Gene TM1040_1156 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	TM1040_1156
Symbol
ID	4075942
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Ruegeria sp. TM1040
Kingdom	Bacteria
Replicon accession	NC_008044
Strand	-
Start bp	1247435
End bp	1248664
Gene Length	1230 bp
Protein Length	409 aa
Translation table	11
GC content	62%
IMG OID	638006461
Product	major facilitator transporter
Protein accession	YP_613151
Protein GI	99080997
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG2814] Arabinose efflux permease
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	27
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	8
Fosmid unclonability p-value	0.0229771
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGCCATGA CTATGACCGC TCCTGCCCCC GACGACCATA TTGCAAAGCG CAATGTTCTG 
ATTCTTGTGC TTGCGCAGGC CTTTTTGGGT GCGCAGATGC CGATGATCTT CATCGTTGGG 
GGGCTGGCCG GTCAATCGCT TGCCACCAAC CCCTGTCTTG CGACATTGCC GATCTCGCTC 
ATTGTCGCGG GTTCGATGAT CTCGGCCACG CCGATCTCTG CGATCATGCA GCGCTTTGGC 
CGGCGCGCTG GTTTTGCGAT CGGGGCCACG GGCGGCGCAC TTGGTGGTCT GATTGGCGGC 
TATGGGCTCT ATACCGGGTC GTTTCCGGTG TTTCTCATCG GCAGCGCCCT CACCGGCGTC 
TACATGAGCG CGCAGGGCTT CTACCGCTTT GCCGCCGCCG ACACCGCCTC TGACAGTTTC 
CGCCCCAAGG CGATTTCCTA TGTCATGGCT GGTGGGCTCT TGTCGGCCAT CATCGGCCCG 
CAGCTGGTCA AAGCCACAAG CGACGCCTTC GTCATTCCTT TCCTTGGCAC CTATATGGCG 
GTGATTGCGG TCAATGTGCT GGGGGTCGGG CTCTTTGCGT TCCTGCGCAT CCCCCGCCCC 
GAAGCCCCGA GCGAGGACGC CCCGATGGGC CGCAGCCGCT GGGAGCTGAT GAAAACACCA 
ACCATTGCCG TCGCGGTCAT CTGCGCCATG GTATCCTATG CGCTGATGAA CCTTGTGATG 
ACCTCGACAC CGCTTGCAGT TGTAGGCTGC GGCTTTGGTC AGGACGCGGC GGCGGATGTG 
GTCACATGGC ACGTTCTGGC CATGTATGTG CCGTCCTTCT TTACCGGGCA TCTGATCGCG 
CGCTTCGGGG TGGAGAAAAT CGTTGGCGCG GGGCTTGTGA TCCTCGCCGG CGCCGGTGCG 
GTCGCCTTGC AGGGCGTAGA ACTCAGCAAC TTCTTTGTGG CGCTTGTCCT TCTGGGCGTC 
GGCTGGAATT TTGGCTTTAT TGGCGCAACC ACAATGCTGG CCGGCGCGCA TGAGGCGCAT 
GAGCGCGGCC GTATGCAGGG TCTCAATGAC CTCTTGGTCT TTGGCGGTGT CACCGTGGCA 
TCACTGGCCT CGGGAGGCCT GATGAACTGC TCAGGCGGCA ACCCGGTCGA GGGCTGGGCC 
GCTGTCAATA TGGCGATGGC GCCCTTCCTG GTTCTCGCGG GGGGCGCACT GATCTGGCTG 
GTGCTGAAAC CCAAATCCGC CGCGGCCTGA

Protein sequence

MAMTMTAPAP DDHIAKRNVL ILVLAQAFLG AQMPMIFIVG GLAGQSLATN PCLATLPISL 
IVAGSMISAT PISAIMQRFG RRAGFAIGAT GGALGGLIGG YGLYTGSFPV FLIGSALTGV 
YMSAQGFYRF AAADTASDSF RPKAISYVMA GGLLSAIIGP QLVKATSDAF VIPFLGTYMA 
VIAVNVLGVG LFAFLRIPRP EAPSEDAPMG RSRWELMKTP TIAVAVICAM VSYALMNLVM 
TSTPLAVVGC GFGQDAAADV VTWHVLAMYV PSFFTGHLIA RFGVEKIVGA GLVILAGAGA 
VALQGVELSN FFVALVLLGV GWNFGFIGAT TMLAGAHEAH ERGRMQGLND LLVFGGVTVA 
SLASGGLMNC SGGNPVEGWA AVNMAMAPFL VLAGGALIWL VLKPKSAAA