Gene TM1040_1097 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	TM1040_1097
Symbol
ID	4077804
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Ruegeria sp. TM1040
Kingdom	Bacteria
Replicon accession	NC_008044
Strand	+
Start bp	1176282
End bp	1177466
Gene Length	1185 bp
Protein Length	394 aa
Translation table	11
GC content	66%
IMG OID	638006401
Product	major facilitator transporter
Protein accession	YP_613092
Protein GI	99080938
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG2814] Arabinose efflux permease
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	32
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	21
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCAGCAGC AGGGGCAGGG GACGAACTGG GTCATGGTGC TCTTGATCTG GGCCGCGGGC 
CTCGGCGCGG CGGCGCAATA CGGCAAGATC GCCGTGATCT TTGACCAGCT GCCTGCGCTT 
TATCCCGGTG TGGGCGCGGC GATGGGCTGG ACGGTGTCGC TGGTGGGGGT GCTGGGGATC 
ATTTTTGGCG TTGTGGCGGG GCTTTATGTG TCGGCCATCG GTTTTCGGCG TACGCTTGTT 
CTGTCGCTGG TGCTTGGCGC GGGGGTCTCG GGCCTGCAGG CGCTGCATCT GCCCTTTGGC 
CTGTTTCTCA TCACGCGCAT GGTCGAGGGG ATCTCCCATC TGGGCGTGGT TGTTGCGGCG 
CCGACGCTGA TGGCGATCCT CGCGCGTGGC CCGGCGCGTG GGGTGGCGCT GACGATCTGG 
AGTACGTTCT TTGGCGTTGC CTTTGCGCTC TTGACGTGGT TCGGGCTGCC GCTCGTCGAG 
GCACGGGGCA TCCCTGCGCT TTTTGCGGTG CATGCGGGGA TGATGGGCCT TCTGGCGCTC 
ATCCTGCATT GGGGGCTGCG CGACTTGCCG GTGCCGCCGC GCGCCAGCTA TCCTGATCTG 
CGCGCCTTGC CATCGCTGCA TCTGAATATC TACCGATCGC CGCACAAGCT GGCGCCTGCC 
GCGGGCTGGC TCTTTTATAC CTGCTGCTTT GTGGCGGTGC TGACGGTGCT GCCGCCCTAT 
ATCGCCGAGA GCCAGCGTGC GCATGTGATG GGGGCGATGC CTCTGGTGTC GATCGTGGTC 
TCTCTGACGC TTGGGGCTGG CCTGCTGCGC GTGACCTCGG GGGTCAAAGT GGTGCAGCTT 
GGGTTCCTCA TCGGCACGGT GGCGATGCTC TGGCTTTGGG CGATGCCGGG GTACTGGCTG 
GCCTGCATGG TCTTGGCGGC GGGGTTCGGG CTGGTGCAGG GGGCCAGCTT TGCTTCTGTG 
CCGCAGCTCA ATGACACGCC TTCGACGCAA TCAGAGGCCA ATGGCGCCAT GGCGCAGGCG 
GGCAACATGG GCAATGCCAT CGGCACACCG CTGTTTGTCG CCGTGCTGAC CTATGGGGGC 
TATGGCTCGC TGGTGCTGAC CGTGGCGCTG CTGCTTTTGG CCGGGGCCGT GGTGCATCAG 
GCGCTTGCGC TGCACCGGCA ACGGGTGGCG CGGGGGGCGG TCTGA

Protein sequence

MQQQGQGTNW VMVLLIWAAG LGAAAQYGKI AVIFDQLPAL YPGVGAAMGW TVSLVGVLGI 
IFGVVAGLYV SAIGFRRTLV LSLVLGAGVS GLQALHLPFG LFLITRMVEG ISHLGVVVAA 
PTLMAILARG PARGVALTIW STFFGVAFAL LTWFGLPLVE ARGIPALFAV HAGMMGLLAL 
ILHWGLRDLP VPPRASYPDL RALPSLHLNI YRSPHKLAPA AGWLFYTCCF VAVLTVLPPY 
IAESQRAHVM GAMPLVSIVV SLTLGAGLLR VTSGVKVVQL GFLIGTVAML WLWAMPGYWL 
ACMVLAAGFG LVQGASFASV PQLNDTPSTQ SEANGAMAQA GNMGNAIGTP LFVAVLTYGG 
YGSLVLTVAL LLLAGAVVHQ ALALHRQRVA RGAV