Gene Hoch_5160 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Hoch_5160
Symbol
ID	8547572
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Haliangium ochraceum DSM 14365
Kingdom	Bacteria
Replicon accession	NC_013440
Strand	+
Start bp	7107488
End bp	7109707
Gene Length	2220 bp
Protein Length	739 aa
Translation table	11
GC content	68%
IMG OID	646389837
Product	4Fe-4S ferredoxin iron-sulfur binding domain protein
Protein accession	YP_003269541
Protein GI	262198332
COG category	[C] Energy production and conversion
COG ID	[COG1142] Fe-S-cluster-containing hydrogenase components 2
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	10
Plasmid unclonability p-value	0.8765
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	18
Fosmid unclonability p-value	0.911102
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGAAGGCG GCGGGCCTCC GCCCGCGAGC CCCGCAATGC TAACACCCGA GCTGCAGGAG 
GGCTACGAGC AGCTCCGGCA GCTCAACATC TTCGACGGCG TCCCCCACGA GGTGCTCGGC 
GCGGCGTTGT CCTCCGGTGG AATCCAGCGC CGCAGCTTCG CGCGCGACAT CATCATCGCC 
GACCCGAGCA GCATCCAGAA CGACTCGGCG AGCATCTGCT ACGTGATCCA GGGGCAGGTG 
GCGGTCGCCG TATTCGACGC TGGCGAGCTC GAGCAGCGCC GCGCCGAGCA ACAGCGGCGC 
GCGCAGATGA ACGAAAAAGA GCGCCAGGAG CTGTCGCTGC TGCCGCCGCC GCCGCTGGCG 
CGCACGGCCA AGAAGAACCT GGCCCTGTTC ATGGAGGGCG ACCTGTTCAA CGCCAAGTCG 
CTGGCCAGCG TGGCCGGCGA CAACCCGGCG GCCTTCTACG CGGTCGGCCC CGCGGTGGTC 
GCGTTCATCG ACAACGCCAC CATGGCCAAC CTGGCCAGCA CCTATCCCTT CTTCGAGGCC 
CGCTTCCGGC GCGCCATCGA GAGCGCCTAC GCGCGCCTGG GCAACGTCAC CGGGGTCAAG 
CAGGAGCTGC TCGACTTCTT CGTCCGCCAG GGCATCTCGG TCGCCGGCCC CACGGTGCGC 
GTGCGCCAGC TCGACCGCTG CATCGACTGC AAGATGTGCG AGAAGGCCTG CGAGGACCGC 
TACGGCTCCA AGCGCCTCAC GCTGGGCGGC TACCAGCTCG GCATGATCGA CTTCGTCTAC 
ACCTGCCGCA CCTGCTCGGA TCAGCGCTGC GTGTCGGGCT GCGAGTACGA CTCGATCAAA 
TTCGACGCCA GCCGCGGCGA GGTGGTCATC AACGAGGCCA CCTGCGTGGG CTGCACCATG 
TGCGCGCAGT CGTGCCCGTT CCACGCCATC GAGATGGTCG ACATCGAAGA CCCCTCGCAT 
CCCAACCACC GCACCGCCTT CAAAGCCCGC CTCGACGAGG CCGGCTCGCT CAAGTTCGGG 
CCCGGCACCG GACGCGTCGC CCGCCCGCGG CGCATCGCCA ACAAGTGCGA CCACTGCGTG 
CAGTTCTTCG ATCAGGCCTG CGTCTCGGCC TGCCCGACCA GCGCGCTCAT CGAGATCTCG 
CCCGAGCAGC TCTTCCGCGA GCGCTCGGCC AGCGCGCGCA CGCTCGCCGA GGCCGGCTAC 
GACCGCGACC TGCGACCGGA CAAGAAAGAG CTGCTGCCGA CCCAGCCCTT CACCCGCGGC 
ATCGGCGTCA AGGACGGCGG CAAAGCCAAG ATCCGCCGCG GCAAGGTCCT GCCCGTCATC 
TGCTGGGCGC TGGGCCTGGC GACCTTCGTC CTGGCCGTGG CCGAGGTGGT GCTGCGCGCC 
TACTGGCCGA CGCGCTCGCT CCAGTACTTC TGGCTGATGA ACGACCCCAA CGCGGTCCAG 
GGCATCATCC TCGAGAAGAT CCGCTTCGTC CCCGGCGACG AGCTGGCCAT GTGGTGCGGC 
TACCTCGGCA CCCTGCTGAT GATGGTGGCC ACAGCGTATC CCATGATGCG GCGGATGAAG 
ATCTTCCGCC GCGTGGCCGC CAACACCATG TACTTCGATC TGCACATGAT GTCGGGCACC 
GTGGGGCCGA TGTTCATCGT GCTGCACGCC GCCTTCAAGC TCGACAACTG GGTGGCCTTG 
GCCTTCTGGG CCATGGTCAT CGTGGTGCTC TCGGGCGTGA TCGGCCGCTA TCTCTACACC 
CAGGTGCCCG ACCTGGCGCA CGGCCGCGAT CTCGAGGATC TCGAGCACAA GCGCGCGCTC 
GCCGACCTGC GCAGCAGTCA CCCCGAGGCC ACGGCCATCG CCGAGGGCAT CATCGCCGAG 
CACCAGCGCG CGGCCGCGCG GGTCGCCCGC AACGCCGGCC TGATGTACGC GCTGCTGTGG 
ATCGTGAGCG AAGATGTGCG GCGGCCCACC CGTTGGCTGT CGCGGCGTCA CAAAATCGGC 
AAGAGTTCCG CGCCCAAAGC CGTGAAGCGC GAGTTGATCC GGCGCACCGG ACGCATGATA 
CTCCTCGACA GGCGCGGCGT GCTGGTGTCA CGGGCGCAGC TCCTGCTGCA CTCGTGGAAA 
ATCGTCCACG TCCCCTTCAC GATCCTCATG GTCGCTTTGT CGGCCATTCA CATCTGGCAG 
CAGTTCGATT TCGTGGTCGC CGACTGGACG CTGCTGGTCG CCCTCATCTC CGGAGATTGA

Protein sequence

MEGGGPPPAS PAMLTPELQE GYEQLRQLNI FDGVPHEVLG AALSSGGIQR RSFARDIIIA 
DPSSIQNDSA SICYVIQGQV AVAVFDAGEL EQRRAEQQRR AQMNEKERQE LSLLPPPPLA 
RTAKKNLALF MEGDLFNAKS LASVAGDNPA AFYAVGPAVV AFIDNATMAN LASTYPFFEA 
RFRRAIESAY ARLGNVTGVK QELLDFFVRQ GISVAGPTVR VRQLDRCIDC KMCEKACEDR 
YGSKRLTLGG YQLGMIDFVY TCRTCSDQRC VSGCEYDSIK FDASRGEVVI NEATCVGCTM 
CAQSCPFHAI EMVDIEDPSH PNHRTAFKAR LDEAGSLKFG PGTGRVARPR RIANKCDHCV 
QFFDQACVSA CPTSALIEIS PEQLFRERSA SARTLAEAGY DRDLRPDKKE LLPTQPFTRG 
IGVKDGGKAK IRRGKVLPVI CWALGLATFV LAVAEVVLRA YWPTRSLQYF WLMNDPNAVQ 
GIILEKIRFV PGDELAMWCG YLGTLLMMVA TAYPMMRRMK IFRRVAANTM YFDLHMMSGT 
VGPMFIVLHA AFKLDNWVAL AFWAMVIVVL SGVIGRYLYT QVPDLAHGRD LEDLEHKRAL 
ADLRSSHPEA TAIAEGIIAE HQRAAARVAR NAGLMYALLW IVSEDVRRPT RWLSRRHKIG 
KSSAPKAVKR ELIRRTGRMI LLDRRGVLVS RAQLLLHSWK IVHVPFTILM VALSAIHIWQ 
QFDFVVADWT LLVALISGD