Gene TM1040_1094 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	TM1040_1094
Symbol
ID	4076327
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Ruegeria sp. TM1040
Kingdom	Bacteria
Replicon accession	NC_008044
Strand	+
Start bp	1172453
End bp	1173727
Gene Length	1275 bp
Protein Length	424 aa
Translation table	11
GC content	61%
IMG OID	638006398
Product	major facilitator transporter
Protein accession	YP_613089
Protein GI	99080935
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG2814] Arabinose efflux permease
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	27
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	19
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCTGCAAG TTCTGTCGAG CGCCTGGGCG CTTTTGCTGG GCATTGGCCT TTTGATGTTG 
GGCAACGGCC TGCAAGGCAC GCTGCTGGGT GTGCGCGGTG GCATCGAGGG CTATTCCGCG 
CTCACCATGT CGCTGGTGAT GTCCACCTAT TTTGTGGGCT TGCTCCTGGG GTCCTGGGTG 
GCGCCGGGGA TGATCCGGCG TGTGGGCCAT GTGCGGGTCT TTGCGGCGCT GGCCTCGCTG 
ATTTCGGCGG TGATGGTGAT CTATCCCGCG CTGCCCAACC CGATTGTCTG GATGCTGGGC 
CGTCTGGTCG TGGGGTTCTG CTTTTCTGGC GTGTATGTCA CCGCCGAAAG CTGGCTCAAC 
AATGCGGCTG ACAACCAGAA CCGAGGCAAG GCGCTCTCTC TCTATATGGT CGTGATGACA 
CTGGGGCTGG TGGCCGCACA GGGTTTCATC CTGATCGGGG ACCCGGCGGG CTATCTGCCG 
TTTGTGATCG CCTCCATCGC GGTTTCGATC TCCTTCGCCC CGATTTTGCT GTCGATTTCG 
CCGACCCCCG CCTTTGATAC GGCCAAGCGG ATGACGCTTC GCGAATTGAT GCATGCCTCG 
CCCCTTGGGT GTGTGGGGAT GTTCCTCATT GGCGGCGTGT TCTCGGCGCA GTTTGGTATG 
TCTGCGGTCT ATGCCACCGA GGCTGGGATG GAGCTGCATC AGGTTTCGCT CTTTGCGGCG 
AGCTTCTATG TCGGTGCGCT CTTTATGCAG TTCCCGCTGG GGCTGCTGTC CGACCGGATG 
GATCGACGGG TGCTGATCAT GATCGTGGCA GGGGTCGCCG GGGTGACCTC GGTGCTGGCG 
ATGCTGCTTG GGGGCACGTT CAGCCTGCTT CTGCTGGCCG CCTTTGTGAT CGGCGGGCTG 
ATCAACCCGC TCTATTCCTT GCTCCTGGCC CACACCAATG ACTTTCTCGA TCACGACGAT 
ATGGCCTCTG CCTCGGGCGG GCTGATCTTT ATCAACGGGC TTGGCGCCTG TAGCGGGCCG 
GTCATCATCG GCTGGCTGAT GTCGGACGCG ATGTTCGGAC CCAACGGGTT CTTCCTCTTC 
ATGGCGATAT TGCTGGGCGT GTTGGTTCTT TATGCCGGGT ATCGCGCAAC GCAGCGTGCG 
ACCATTCCAG TCGAAGAGAC CGGTGTCATG CCCGCCATGA GCCCGACCGC GACCTCGGTC 
GCGGTAGAGG TGGCGCAGGA ATACGCCATC GAAACCGAGC TCGAAGAGCA AGACAGCGCC 
ACAACCACGG GCTGA

Protein sequence

MLQVLSSAWA LLLGIGLLML GNGLQGTLLG VRGGIEGYSA LTMSLVMSTY FVGLLLGSWV 
APGMIRRVGH VRVFAALASL ISAVMVIYPA LPNPIVWMLG RLVVGFCFSG VYVTAESWLN 
NAADNQNRGK ALSLYMVVMT LGLVAAQGFI LIGDPAGYLP FVIASIAVSI SFAPILLSIS 
PTPAFDTAKR MTLRELMHAS PLGCVGMFLI GGVFSAQFGM SAVYATEAGM ELHQVSLFAA 
SFYVGALFMQ FPLGLLSDRM DRRVLIMIVA GVAGVTSVLA MLLGGTFSLL LLAAFVIGGL 
INPLYSLLLA HTNDFLDHDD MASASGGLIF INGLGACSGP VIIGWLMSDA MFGPNGFFLF 
MAILLGVLVL YAGYRATQRA TIPVEETGVM PAMSPTATSV AVEVAQEYAI ETELEEQDSA 
TTTG