Gene TM1040_2672 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	TM1040_2672
Symbol
ID	4077583
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Ruegeria sp. TM1040
Kingdom	Bacteria
Replicon accession	NC_008044
Strand	-
Start bp	2807277
End bp	2808515
Gene Length	1239 bp
Protein Length	412 aa
Translation table	11
GC content	64%
IMG OID	638007996
Product	major facilitator transporter
Protein accession	YP_614666
Protein GI	99082512
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG2814] Arabinose efflux permease
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	26
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	24
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGACCGAT CCACCCCTCT GTTTACCCCC GTCCTGCTGG TGGGCTGCCT GATCATCATG 
GTGAGCTTTG CCGTGCGCGC CTCCTTTGGG GTGTTCCAGA TCCCGATCGC CGATGATTTT 
GGCTGGCTCC GGAGCGAGTT CTCCCTCGCC ATCGCGATCC AGAACCTCGC CTGGGGGATC 
GGGCAGCCGA TCTTTGGCGC CATTGCCGAG AAGATCGGAG ACCGCAAGGC GATCATCATC 
GGGGCCGTGG TCTATGCGGC GGGGCTTGTG CTGAGTGCCG GAGCCACCAC CCCCTTCGAG 
ATGCAGGCCT ATGAGTGGCT GGTGGGCTTT GGCGTTGCGG GCACGGGCTT TGGCGTTGTG 
CTTGCGGTGG TCGGCCGGGC GAGCTCGGAC GAGAACCGGT CCATGTCACT GGCGATTGTC 
ACCGCGGCAG GCTCTGCGGG GCAGATCTTC GGCGCGCCGA CGGCGGAATA TATGCTTGGC 
CTGATGTCCT GGCAGTCGGT GTTCCTGGTC TTTGCCGGCG TGGTGCTGGC GCTGATCCTG 
TCGCTGCCCC TGATGCGCGC GCCGGTCTCT GCGGGCAAGG CGGAGCTTGA GGAAAGCATG 
GGCGCGATCC TCAAAAAAGC CTTCCGCGAC CCGTCCTATA CGCTGATATT CCTCGGGTTT 
TTCAGCTGTG GCTATCAGCT GGCCTTTGTG ACGGCGCATT TTCCGGCCTT TGTGACCGAG 
ATGTGCGGGC CGATCATGCC CGGCGGTGTG CTGCATGGGA TGGGGATCAC CACCACCTCG 
GCGCTGGGTG CGGTGTCGAT TTCGCTCATC GGTCTGGCGA ATGTGGCAGG CACGCTGCTC 
GCGGGCTGGG CGGGCAAGCA TTACTCCAAG AAATATCTGC TGGCGGGGAT CTACACCGCG 
CGGACCATCG TGGCCGGGGC CTTTATCCTG CTGCCGATCA CGCCTTTGTC GGTGATCCTC 
TTTTCGGTGG CGATGGGCTC GCTCTGGCTC GCGACCGTGC CGCTTACTTC CGGGCTGGTC 
GCGCATATCT ACGGGCTGCG CTACATGGGG ACGCTCTATG GGATCGTGTT CCTGAGCCAC 
CAGATCGGCG GGTTCCTCGG CGTGTGGCTC GGTGGGCGGA TGTATGACAT CTATGGCGAC 
TACACGATGG TCTGGTGGAT CGGTGTGGGC GTCGGAGCCT TCAGCGCGAT TGTGCATCTG 
CCGGTGCGCG AGCGTCCGTT GCAGGCGGCT GCGGCCTGA

Protein sequence

MDRSTPLFTP VLLVGCLIIM VSFAVRASFG VFQIPIADDF GWLRSEFSLA IAIQNLAWGI 
GQPIFGAIAE KIGDRKAIII GAVVYAAGLV LSAGATTPFE MQAYEWLVGF GVAGTGFGVV 
LAVVGRASSD ENRSMSLAIV TAAGSAGQIF GAPTAEYMLG LMSWQSVFLV FAGVVLALIL 
SLPLMRAPVS AGKAELEESM GAILKKAFRD PSYTLIFLGF FSCGYQLAFV TAHFPAFVTE 
MCGPIMPGGV LHGMGITTTS ALGAVSISLI GLANVAGTLL AGWAGKHYSK KYLLAGIYTA 
RTIVAGAFIL LPITPLSVIL FSVAMGSLWL ATVPLTSGLV AHIYGLRYMG TLYGIVFLSH 
QIGGFLGVWL GGRMYDIYGD YTMVWWIGVG VGAFSAIVHL PVRERPLQAA AA