Gene TM1040_3601 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	TM1040_3601
Symbol
ID	4075028
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Ruegeria sp. TM1040
Kingdom	Bacteria
Replicon accession	NC_008043
Strand	-
Start bp	650134
End bp	651030
Gene Length	897 bp
Protein Length	298 aa
Translation table	11
GC content	61%
IMG OID	638005120
Product	binding-protein-dependent transport systems inner membrane component
Protein accession	YP_611830
Protein GI	99078572
COG category	[E] Amino acid transport and metabolism [P] Inorganic ion transport and metabolism
COG ID	[COG1173] ABC-type dipeptide/oligopeptide/nickel transport systems, permease components
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	27
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	19
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGACCGACG CAACTGATCC TCTCTATCAA GAAATCCAAG GGCCGACGCC GCGCCAGATG 
CTGAAGACGC GCGCGCTTGG TCACAAGGGG CTAATCTTTG GCCTCTGTGT GGTTGGCCTC 
TTGGTCGTGA TCGCCCTCCT CGCCCCGGTT CTGGCGCCAC ATAATCCCTA TGAGCAAAGC 
CTGATGAACC GCATGGTACC CCCTGTTTTT CTGGGCGGCA CATGGGAGCA TCCCCTCGGC 
ACCGACCATC TCGGGCGGGA TTACCTGTCA CGCCTGATCT ACGGCGCGCG GGTTTCGCTT 
CTGATCGGCG CAGTCGCTGC GCTGATTTCT GGCGTGATCG GCACCGCCAT GGGGGTTGCA 
GCCGGGTATT TCGGCGGCAA GGTCGACGCG GTTGTGACCT TCCTCATAAA CGTGCGCCTG 
GCGATGCCCG TGGTCCTGGT GGCGCTGGCT GTCGTGGCAA TCCTTGGCGG GTCTTTGACG 
GTCGTGGTCT GCGTGCTCGG CCTATTGTTG TGGGACCGAT TTGCCGTGGT GATGCGGGCG 
TCGACCTTGC AGGTCAGCCG TCGCGACTAC GTGGCCGCCG CTCAGGTGAT CGGAGCCTCG 
ACCCCGCGCA TCCTCTTGAC CGAGATCATG CCAAATATCT TCAACAACCT GATCGTGGTG 
ATCACGCTGG AGATGGCCCA TGCGATCCTG CTCGAAGCGG CACTGAGCTT CCTTGGTCTA 
GGCGTGCAAC CGCCGACCCC TTCGTGGGGT CTGATGGTGA GCGAAGGCAA AAACATGATG 
TTGTTTGAGC CTTGGCTGGT TCTCATTCCC GGCGCCGTTT TGTTCCTGCT TGTGCTGGCA 
ATCAATCTCA TGGGCGATGG TCTGCGCGAC GTCACCGCCC CCGAAGGACG GAGCTGA

Protein sequence

MTDATDPLYQ EIQGPTPRQM LKTRALGHKG LIFGLCVVGL LVVIALLAPV LAPHNPYEQS 
LMNRMVPPVF LGGTWEHPLG TDHLGRDYLS RLIYGARVSL LIGAVAALIS GVIGTAMGVA 
AGYFGGKVDA VVTFLINVRL AMPVVLVALA VVAILGGSLT VVVCVLGLLL WDRFAVVMRA 
STLQVSRRDY VAAAQVIGAS TPRILLTEIM PNIFNNLIVV ITLEMAHAIL LEAALSFLGL 
GVQPPTPSWG LMVSEGKNMM LFEPWLVLIP GAVLFLLVLA INLMGDGLRD VTAPEGRS