Gene Daud_2147 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Daud_2147
Symbol
ID	6026186
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Candidatus Desulforudis audaxviator MP104C
Kingdom	Bacteria
Replicon accession	NC_010424
Strand	-
Start bp	2263381
End bp	2264628
Gene Length	1248 bp
Protein Length	415 aa
Translation table	11
GC content	66%
IMG OID	641594965
Product	glycine hydroxymethyltransferase
Protein accession	YP_001718266
Protein GI	169832284
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0112] Glycine/serine hydroxymethyltransferase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	30
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGTCTGGA ACCGGTCCCT GGCCGAAACC GACCCCGAAA TCGCCCGGGC CATCGCGCTG 
GAGATCACCC GTCAAGGCGC CAAGCTTGAG CTGATCGCCT CCGAGAACTT CGTCAGCCGC 
GCCGTCCTGG AAGCCCAGGG TTCGGTGCTG ACGAACAAGT ACGCCGAGGG CTATCCCGGC 
GCGCGCTACT ACGGCGGCTG CGAGTACGTG GACATCGTGG AGAGTGTGGC GATCAGGCGG 
GCGAAGGAAA TCTTCGGCGC CGGGCACGCG AACGTGCAGC CCCACTCCGG GGCCCAGGCC 
AACATGGCCG CCTATTTCGC CTTCCTCGAA CCGGGCGACA CGATCATGGG GATGCGTCTG 
GCCCACGGGG GGCACCTGAC CCACGGCGCG AAGATCAATT TCTCGGGCCG GTACTTCCGG 
TACGTGCCCT ACGGGGTGGA GGAGGAAACC GGCCGGATTG ACTACGACCG GATGCATGCC 
ATCGCCCGCG AACACCGCCC GAAACTGATC GTCGGCGGGG CCAGCGCCTA CCCGCGCGAA 
CTGGACTTCG CCCGGATGCG TGCCATTGCG GATGACGTCG GTGCGCTCTT GATGATCGAC 
ATGGCGCACA TTGCCGGCCT GATCGCCGCC GGACTGCACA TGTCCCCGGT GCCGTACGCC 
GACGTGGTGA CCACCACGAC CCACAAAACC CTGCGCGGCC CGCGGGGCGG GATGATCCTG 
TGCCCGGAGG AGTACGCCGC CGCCATTGAC AAGGCGGTAT TCCCGGGAAT CCAGGGCGGC 
CCTCTGATGC ACGTGATCGC GGCCAAGGCC GTGGCCCTGG GCGAGGCTCA GCGCCCCGAG 
TTCAAGACCT ACCAGGAACA AATCGTGAAA AACGCCCGCG CCTTAGCCCA AGCCCTGCAG 
GAGCGGGGTT TTGAGCTGGT GGCGGGCGGC ACCGACACCC ACCTGATCCT GGTCGACCTC 
CGGAACAAGG GCCTCACCGG CGCCGTGGCC GAGGACCTTC TGGACCGGGT GGACGTCACC 
GTGAACAAGA ACATGGTTCC GTTCGATCCC CAGCCGCCCC GGGTCACCAG CGGCATCCGC 
ATCGGCACCC CGGCGGTCAC CACCCGCGGG ATGAAGGAGG ACAGCATGGT CCAGATCGCC 
GAGGTGATCA GCCTGACTCT GGATCATCCG GAAGAAGGGG CCGTCCAGGC GCGGGCGAAA 
GCCATTGTTG CCGAATTGTG CGCCGCCCAC CCGTTCCTGA AACTGTAG

Protein sequence

MVWNRSLAET DPEIARAIAL EITRQGAKLE LIASENFVSR AVLEAQGSVL TNKYAEGYPG 
ARYYGGCEYV DIVESVAIRR AKEIFGAGHA NVQPHSGAQA NMAAYFAFLE PGDTIMGMRL 
AHGGHLTHGA KINFSGRYFR YVPYGVEEET GRIDYDRMHA IAREHRPKLI VGGASAYPRE 
LDFARMRAIA DDVGALLMID MAHIAGLIAA GLHMSPVPYA DVVTTTTHKT LRGPRGGMIL 
CPEEYAAAID KAVFPGIQGG PLMHVIAAKA VALGEAQRPE FKTYQEQIVK NARALAQALQ 
ERGFELVAGG TDTHLILVDL RNKGLTGAVA EDLLDRVDVT VNKNMVPFDP QPPRVTSGIR 
IGTPAVTTRG MKEDSMVQIA EVISLTLDHP EEGAVQARAK AIVAELCAAH PFLKL