Gene Daro_1069 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Daro_1069
Symbol
ID	3568135
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Dechloromonas aromatica RCB
Kingdom	Bacteria
Replicon accession	NC_007298
Strand	-
Start bp	1171209
End bp	1172417
Gene Length	1209 bp
Protein Length	402 aa
Translation table	11
GC content	65%
IMG OID	637679531
Product	major facilitator transporter
Protein accession	YP_284295
Protein GI	71906708
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG2814] Arabinose efflux permease
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	52
Plasmid unclonability p-value	0.763435
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	20
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTCGATCC AGCCTGAGCC TTCCCCACGC GTTGTCATGC GCCGCAATGT CCTGCTGCTT 
GCCCTGTCGC AGGCGGCAGT GATGACCAGC ATCAGCCTCG TGCTGGCTTC TTCGGTGCTG 
ATCGGCGTGC AACTCGCTTC GCCGGCGCTA TCGACCTTGC CGCTGGCGCT GCAGTACCTG 
AGCACGATGC TGGTGCTCTA CCCGGTGGCG CGGTTGATCA GCCGCTACGG GCATCGCCCG 
GTATTTTTCG GTGGGGCGCT GTTGGGCGCA CTGGGTTTGG CGATCGCGGC GGCCGGTATC 
TGGCTGGGCA ATTTTGTGCT GTTCGCCCTG GCTGGTGGGC TGATCGGCAT TTTCAACGCG 
GTCAGCCAGT ACTACCGCTT TGCTGCCGCC GACGCGGTGC CGGTTGAGCG ACGGAGTTCA 
GCCATTTCCC TGACCTTGAG TGGCGGCGTG CTGGCGGCGC TGGCCGGCCC GAGCCTGGCC 
CGGTGGACCA AGGATGCGCT GCAGCCAGCC TTTGCCGCCA GTTTTCTGGC CCTGGTGGGC 
GTTGCCCTGC TCGCCGCCTG GCTGGCGACC CGTTTGCGCC TGGCGCCACC GGCAGTGACC 
GATCAGCAGC GCCCGCCGGC ACCGTTCGCC CCGCTCCTGC GCCAGCCGGA TTTCCTGCTG 
GCGGTAGTCG TCGGTGTCGT CGGCTATGCC TTGATGAACC TGCTAATGAC GGCAACGCCG 
CTGGCGATGA TGTGCAGCCA CCTTGGCTTT GCCGAGACGG CGACGGTAAT TCAGTGGCAC 
GTCGTCGCGA TGTTTGCGCC CTCCTTCTTC ACCGGGGCAT TGATCCAGCG GATTGGCGTG 
CTGCCGGTGA TGTTGCTGGG TGGCGCTGGC CTGCTCGGTT GCATCGCGGT CGCGGTTAAC 
GGCGACAGCC TGCCGCATTT CGAACTGGCG CTGATCATGC TCGGCATCGG CTGGAATTTC 
CTTTACGTCG GTGCCACGAC GCGTCTGGTC GAAATCTGCC CGCCCGAGCA GAAAGCCCGC 
GTCCAGGCGT TTAACGACAG CCTGGTCTTT CTCGCCATTG CCGGTGTGAC CTTCAGTTCA 
GGCAGCCTGG TCGACCGCTT CGGCTGGCCG GCACTGAATC TCTACGCCGC AATTCCGGTG 
CTGCTGATCA TGCTGGCGAT CCTCGGTCGC TGGCTTGCGA CAGGGCGCCG GCAATGGCGG 
GTCGCATGA

Protein sequence

MSIQPEPSPR VVMRRNVLLL ALSQAAVMTS ISLVLASSVL IGVQLASPAL STLPLALQYL 
STMLVLYPVA RLISRYGHRP VFFGGALLGA LGLAIAAAGI WLGNFVLFAL AGGLIGIFNA 
VSQYYRFAAA DAVPVERRSS AISLTLSGGV LAALAGPSLA RWTKDALQPA FAASFLALVG 
VALLAAWLAT RLRLAPPAVT DQQRPPAPFA PLLRQPDFLL AVVVGVVGYA LMNLLMTATP 
LAMMCSHLGF AETATVIQWH VVAMFAPSFF TGALIQRIGV LPVMLLGGAG LLGCIAVAVN 
GDSLPHFELA LIMLGIGWNF LYVGATTRLV EICPPEQKAR VQAFNDSLVF LAIAGVTFSS 
GSLVDRFGWP ALNLYAAIPV LLIMLAILGR WLATGRRQWR VA