Gene Dgeo_1610 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Dgeo_1610
Symbol
ID	4057301
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Deinococcus geothermalis DSM 11300
Kingdom	Bacteria
Replicon accession	NC_008025
Strand	-
Start bp	1712606
End bp	1713772
Gene Length	1167 bp
Protein Length	388 aa
Translation table	11
GC content	68%
IMG OID	641230633
Product	major facilitator transporter
Protein accession	YP_605074
Protein GI	94985710
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG2814] Arabinose efflux permease
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	25
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	14
Fosmid unclonability p-value	0.367588
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCAAGCGA CCGCTGCCCA CACCGCCGCC CGCCACGCTG CCGCCATCGC GGTCGCGGTC 
ACGGCGGGCC ACTTTATCAA TGATGCCTAC GGGGCGATGC TCACGCCCCT GACCCCGGCC 
CTGCAGGGCA AGTTTGGCGT CAGCATCGCG GCCGTGACCC TGCTCTCCAG CGTCTACAGC 
CTCACCAGCA GCGTGCTGCA ACCGCTGCTC GGCATCCTGG GTGAACGAGT GGATCGCCGT 
TACGCCGCCG CGCTTGGCCC GCTGATGACT GGCCTGGGTC TCACGCTGCT GGGCTTTGTG 
CCCTGGTTTG GGGCGCTCGT GCTGCTGGTG GCGGTGGCGG GATTCGGCAG CGGGTTCTTT 
CACCCGGCGG GCGCAGCCTA CGTCGCCCTG AATAGCCCGC CCCAGAAGCG GGGACTGTGG 
GCCAGCTTAT TTAGCGCGGG CGGCACGGCG GGGATGGCGC TGGGGCCGGT GTTCGCGGGT 
GTGGGCCTCA CGCACTTGCC CTGGTTTGCC CTGATCGGGG CCGTGATTGC TGCTTTGACC 
TTTGCCCTGA CGCCGTCCAG CCTGGCGACG GGGCGCCGGA TCAGCCTGGC CGAGTATGCC 
CGCATCTTCC GGGGGCCGCT GGTGTGGCTG TGGGGGATGG CGGTGCTGCG CTCGCTTGCC 
AGCATGGGCT ACAACGCGAT GCTCCCCTTT ATCCTCAAAA ACCGCGGCTT CGGAATGCGC 
GAGGTGGGCA TCACATTGGC CGTGTATGCC GTCGCGAGTG CCGTTGGCGG CATCGTCGGT 
GGGCGGGCCA GCGACCGTTA CGGGCGGGTG CCGGTGCTGC GTTCGGCCAT TCTCAGCACC 
ATTCCGCCCT TCGCGCTGCT GATCCTGTCC AGTCCGGCAA ACTGGTGGTT TTATCCGCTC 
ACGTTTCTGG TGGGGGCGGC GGTCAACGCC AGCATCCCGG TCGGGGTGGT CGCGGCGCAG 
GAGTACGCGC CGGGGCACGT CGCCGTCGCC AGCTCCATCA TGATGGGGTT CTCGTGGGGA 
TTTGCGGGGT TGCTGGTCTT TCTGGTGGGG GCGCTGGCGG ATGCCAGCAC GCCGACCATC 
GCCGCGCTCG CCAGCCTGAC CCTCTTGATT CCGAGTGCTT TGATCGCCTA CCGGTTGCCG 
GAGCCGCGGG GAGCGGCGTT CGAGTAG

Protein sequence

MQATAAHTAA RHAAAIAVAV TAGHFINDAY GAMLTPLTPA LQGKFGVSIA AVTLLSSVYS 
LTSSVLQPLL GILGERVDRR YAAALGPLMT GLGLTLLGFV PWFGALVLLV AVAGFGSGFF 
HPAGAAYVAL NSPPQKRGLW ASLFSAGGTA GMALGPVFAG VGLTHLPWFA LIGAVIAALT 
FALTPSSLAT GRRISLAEYA RIFRGPLVWL WGMAVLRSLA SMGYNAMLPF ILKNRGFGMR 
EVGITLAVYA VASAVGGIVG GRASDRYGRV PVLRSAILST IPPFALLILS SPANWWFYPL 
TFLVGAAVNA SIPVGVVAAQ EYAPGHVAVA SSIMMGFSWG FAGLLVFLVG ALADASTPTI 
AALASLTLLI PSALIAYRLP EPRGAAFE