Gene TM1040_3303 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	TM1040_3303
Symbol
ID	4075707
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Ruegeria sp. TM1040
Kingdom	Bacteria
Replicon accession	NC_008043
Strand	-
Start bp	310065
End bp	311162
Gene Length	1098 bp
Protein Length	365 aa
Translation table	11
GC content	59%
IMG OID	638004811
Product	ABC transporter related
Protein accession	YP_611537
Protein GI	99078279
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG3839] ABC-type sugar transport systems, ATPase components
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	20
Plasmid unclonability p-value	0.700812
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	16
Fosmid unclonability p-value	0.735765
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGCGAATT TGAAACTGAC CGGGGTAGAG AAAACCTACG CTGGCGCGGT GAATGTCCTG 
AGAGACATCA ATCTCGACAT CAAGCAGGGG GAGTTGATTG TCTTTGTGGG TCCGTCGGGA 
TGCGGCAAGT CCACGCTCCT GCGCATGATC GCGGGGCTGG AACGCATAAC CGGTGGGACA 
TTGGAAATCG ACGGCGCGGT GATGAATGAC ATCCCGCCCG CCCAGCGGGG CATCGCCATG 
GTGTTCCAGA GCTACGCGCT CTATCCACAT ATGACGGTGC GCGACAACAT GGGCTTTGCG 
CTCAAGATCG CAGGTAAAAG CGCAAGCGAG ATTGAGGAGG CGATCACACG AGCAGCCAAG 
ATCCTGCAGC TTGAGGACTA TCTCGACCGT CTGCCCAAGG CGCTTTCAGG TGGGCAGCGG 
CAGCGGGTGG CAATCGGTCG GGCGATTGTG CGCGATCCAA AGGTCTATCT CTTTGATGAG 
CCTCTCTCCA ATCTGGACGC GGCCCTGCGG GTGGCGACGC GGATCGAGAT TGCGCAGCTC 
AAGGAAGCGA TGCCGGACAG CACCATGATC TATGTGACCC ACGACCAGGT GGAGGCGATG 
ACGCTCGCTT CACGCATCGT TGTGCTCGCC AATAAGGGGA TCGCGCAGGT GGGCACGCCG 
CTCGAACTCT ACGAGCGGCC CGAAAACGAA TTTGTCGCCC AGTTTATTGG TTCTCCGGCG 
ATGAACCTGC TGCCGGGCGA GGTCATCGCA ACGGGCGATC TGACCCGCAT TCGCCTGGAG 
AATGGTGAAG AGGTCGCCTC CACCGTGCCC ACCCGCACGA GCGACATGGG GCTCAAGGTC 
AATGTGGGCG TGCGACCAGA GGATCTCTTT GAGGAGGGGG AGGGCGGCGC GATGATCGAC 
GCTACGGTCG ACATCGTCGA AGCACTTGGT GAAGTGACGG TGCTCTATTT CAAGGCGCAA 
GCCGGGCAAG ATGCGCCTGT TGCAAAATTG TCTGGTATTC ACAAAGGTTT GCGTGGAAGC 
CAAGTGCGAC TCTACGCGGA TCCGAAGAAG GTACACCTCT TTCACAATGG GCATTCTCTT 
CTGTATCGCG AGGGGTGA

Protein sequence

MANLKLTGVE KTYAGAVNVL RDINLDIKQG ELIVFVGPSG CGKSTLLRMI AGLERITGGT 
LEIDGAVMND IPPAQRGIAM VFQSYALYPH MTVRDNMGFA LKIAGKSASE IEEAITRAAK 
ILQLEDYLDR LPKALSGGQR QRVAIGRAIV RDPKVYLFDE PLSNLDAALR VATRIEIAQL 
KEAMPDSTMI YVTHDQVEAM TLASRIVVLA NKGIAQVGTP LELYERPENE FVAQFIGSPA 
MNLLPGEVIA TGDLTRIRLE NGEEVASTVP TRTSDMGLKV NVGVRPEDLF EEGEGGAMID 
ATVDIVEALG EVTVLYFKAQ AGQDAPVAKL SGIHKGLRGS QVRLYADPKK VHLFHNGHSL 
LYREG