Gene Mbar_A3507 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Mbar_A3507
Symbol	hisD
ID	3624905
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Methanosarcina barkeri str. Fusaro
Kingdom	Archaea
Replicon accession	NC_007355
Strand	-
Start bp	4496463
End bp	4497764
Gene Length	1302 bp
Protein Length	433 aa
Translation table	11
GC content	46%
IMG OID	637702334
Product	histidinol dehydrogenase
Protein accession	YP_306958
Protein GI	73670943
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0141] Histidinol dehydrogenase
TIGRFAM ID	[TIGR00069] histidinol dehydrogenase

Plasmid Coverage information

Num covering plasmid clones	12
Plasmid unclonability p-value	0.044382
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	17
Fosmid unclonability p-value	0.441151
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGTCATGA TGTTATTCAA AAAGTTGTCT GATGTTTCGG AAGCTGAAAT GCAGAAATTG 
CTCTCCCGGG GTTCCGGGCT TGAGGACGTA GCAAAAACCG TTTCAACCGT GCTTTCGGAT 
GTGCGTACCA AAGGAGATTC CGCGCTCAGG GAATATACGG CTAAGTTCGA TAAAGTTGAA 
CTTGCAAACT TTGGGGTAAG TGAGGAGGAA TTTCAACAGG CTCTTTCCGG CATAAGTCCA 
GAACTTCTGG ATCACCTTAA ATCCGCAGCT GCAAACATAC GGGCTTTCCA TGAAGCTCAG 
CTTCCGAAAG CTACCTGGTT TATGGAACTC AAACCAGGGA TCGTGCTGGG TCAAAAGGCA 
ACACCTCTGG AAAGTGTAGG TGCGTATGCT CCAGGAGGGC GGGCATCCTA TCCTTCAACC 
GTGCTCATGA CTGTAATCCC TGCCAGGGTT GCAGGTGTAG AGCAGGTTAT AGTGTGTACG 
CCTCCAAGGC CGGATGGCTC CGTACACCCG CTTACACTTG CCGCTGCAAA GGTTGCAGGG 
GCGGACAAAG TGTTCAAGCT TGGAGGTGTG CAGGCTATAG GGTCAATGGC TTATGGGACT 
GAAACAGTTC CTAAGGTGGA TAAAATCGTA GGGCCTGGAA ATGTTTTTGT CACAGCTGCC 
AAAATGCAGA TCAGGGATGT TGCAGAAATT GATTTTCCGG CCGGCCCAAG CGAAGTACTC 
ATTATTGCAG ATGAGTCCGC AGATGCCGTT ATGGTCGCCT CGGATATTCT TGCACAATCC 
GAACACGATC CAAATTCGGT TTCGATACTC GTCACAGGTT CGGATACGCT GGCAGAAGCT 
GTAAAAAGAG AGGTTCTGGT TCAGGCGGAA CAGGCTGCAA GAAGCAGTAT TATAAAATCT 
TCTCTTGAAA ATGCCGCAAT TCTTATTGCA GATTCCCTGG AACAATGTAT TGGCTTTAGC 
AATAAATTTG CTCCCGAACA CCTTGAGATA ATGGTAGCGG ACCCGGATTT TGTACTTGAC 
AGGATTAAAA ACGCAGGATC GATTTTTATA GGAAACTATT CTCCTGTCCC TGTTGGGGAT 
TATGCCTCAG GTACAAATCA CGTGCTCCCC ACATCTGGAT ATGCCAGAGT TTATTCTGGT 
CTGAATATAA ACCATTTTAT TAAATACTCA AGTATTCAGA GAATCAGTAA GAGTGGGCTT 
GAAAGTCTAA AAGAAACTGT AATCGCATTA GCCGAGGAAG AGGGTCTACA GGCACATGCT 
GATGCTATTA GAACTCGTTT TGGGTATAAA CCCTCTAAAT AA

Protein sequence

MVMMLFKKLS DVSEAEMQKL LSRGSGLEDV AKTVSTVLSD VRTKGDSALR EYTAKFDKVE 
LANFGVSEEE FQQALSGISP ELLDHLKSAA ANIRAFHEAQ LPKATWFMEL KPGIVLGQKA 
TPLESVGAYA PGGRASYPST VLMTVIPARV AGVEQVIVCT PPRPDGSVHP LTLAAAKVAG 
ADKVFKLGGV QAIGSMAYGT ETVPKVDKIV GPGNVFVTAA KMQIRDVAEI DFPAGPSEVL 
IIADESADAV MVASDILAQS EHDPNSVSIL VTGSDTLAEA VKREVLVQAE QAARSSIIKS 
SLENAAILIA DSLEQCIGFS NKFAPEHLEI MVADPDFVLD RIKNAGSIFI GNYSPVPVGD 
YASGTNHVLP TSGYARVYSG LNINHFIKYS SIQRISKSGL ESLKETVIAL AEEEGLQAHA 
DAIRTRFGYK PSK