Gene Dgeo_2547 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Dgeo_2547
Symbol
ID	4073778
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Deinococcus geothermalis DSM 11300
Kingdom	Bacteria
Replicon accession	NC_008010
Strand	+
Start bp	502551
End bp	503852
Gene Length	1302 bp
Protein Length	433 aa
Translation table	11
GC content	67%
IMG OID	641228928
Product	arsenical pump membrane protein
Protein accession	YP_594055
Protein GI	94972015
COG category	[P] Inorganic ion transport and metabolism
COG ID	[COG1055] Na+/H+ antiporter NhaD and related arsenite permeases
TIGRFAM ID	[TIGR00935] arsenical pump membrane protein

Plasmid Coverage information

Num covering plasmid clones	7
Plasmid unclonability p-value	0.545416
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGCTGCTCG CCGTCCTGAT CTTCCTGTTC ACCCTCGTCC TCGTCATCTG GCAGCCGAAG 
CTCAGGTGGC AACCAGGGGG CCTGGGCATC GGCTGGAGTG CGTCACTCGG CGCGGTCCTC 
GCCCTGCTCA CCGGGGTCGT CCACCTCGCG GACATTCCGG TGGTGTGGAA CATCGTGTGG 
AACGCGACCA TCACCTTCGT TGCCCTCATC ATCATCAGCC TGATCCTCGA CGAGGCCGGG 
TTCTTCAAGT GGTCTGCCCT GCACGTGGCC CGCTGGGGCC GCGGGCACGG CCACCTGCTC 
TTTGCTCTGG TGATCCTGTT GGGTGCCGCC GTGAGTGCCC TGTTCGCCAA CGACGGCACG 
GCGCTGATCC TCACGCCCAT CGTGCTCGCC ATGCTCACCG CGCTGGGCTT CCGGCCCGCC 
ACCACCCTCG CGTTCATCCT CGCCACGGGG TTCATCGCCG ACAGTGCCAG CCTGCCGCTG 
GTCATCAGCA ACCTGGTGAA CATTGTCAGC GCCGACTACT TCAACCTGGA CTTCGGACAG 
TACGCCAGGG TGATGGTGCC GGTGGACCTC GCGGCGATCC TCGCCAGTCT CGGCGTGCTG 
TACGTGATGT TCCGCCGCGA TCTGCCTGCG CGTTACGACC CAGGCACGCT GGGAACGCCT 
GCCCAGGCCA TCCGTGACCC CAACGTCTTC CGGGTGGGCT GGATCGTCCT GGTGGTCCTG 
CTGGTCGGGT ACTTCGCCGC CGGGCCGCTC GGGGTGCCCG TCAGCCTGGT CGCGGCGCTG 
GGGGCAGGCC TCCTGTGGCT CGTCGCCGCT CGTGGGCACG TCGTGAGCAC CCGGAACGTC 
CTCAGGGGCG CGCCCTGGCA GATCGTCATT TTCTCGCTGG GCATGTACCT GGTCGTGTAC 
GGTCTGCGAA ACGCCGGGCT GACCGACTTG CTGGCGGGCG TCCTTGACCG ACTGGCTCAG 
GGCGGACTTT GGAGCGCCAC CCTCGGCACC GGCTTTCTGA CCGCCTTCCT CGCCAGTGTG 
ATGAACAACA TGCCCAGCGT CCTGATCGGC GCGCTCGCCA TCGACGCCAG CCAGGCCACC 
GGAGCCGTCA AGCAGGGCAT GGTCTACGCG AATGTCGTCG GCAACGACCT GGGGCCGAAG 
ATCACGCCCA TCGGGAGCCT CGCCACGCTG CTGTGGCTGC ACGTGCTGGC CAGCAAGGGG 
ATCCGCATCG GGTGGGGCCA GTATTTCCGG GTCGGGATCG TCCTCACGCT GCCGGTGCTG 
CTGGTCACGC TCGCGGCGCT CGCGCTGCGC CTGGGAGGCT GA

Protein sequence

MLLAVLIFLF TLVLVIWQPK LRWQPGGLGI GWSASLGAVL ALLTGVVHLA DIPVVWNIVW 
NATITFVALI IISLILDEAG FFKWSALHVA RWGRGHGHLL FALVILLGAA VSALFANDGT 
ALILTPIVLA MLTALGFRPA TTLAFILATG FIADSASLPL VISNLVNIVS ADYFNLDFGQ 
YARVMVPVDL AAILASLGVL YVMFRRDLPA RYDPGTLGTP AQAIRDPNVF RVGWIVLVVL 
LVGYFAAGPL GVPVSLVAAL GAGLLWLVAA RGHVVSTRNV LRGAPWQIVI FSLGMYLVVY 
GLRNAGLTDL LAGVLDRLAQ GGLWSATLGT GFLTAFLASV MNNMPSVLIG ALAIDASQAT 
GAVKQGMVYA NVVGNDLGPK ITPIGSLATL LWLHVLASKG IRIGWGQYFR VGIVLTLPVL 
LVTLAALALR LGG