Gene Hoch_3584 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Hoch_3584
Symbol
ID	8545974
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Haliangium ochraceum DSM 14365
Kingdom	Bacteria
Replicon accession	NC_013440
Strand	-
Start bp	4937191
End bp	4938468
Gene Length	1278 bp
Protein Length	425 aa
Translation table	11
GC content	63%
IMG OID	646388253
Product	citrate synthase I
Protein accession	YP_003267979
Protein GI	262196770
COG category	[C] Energy production and conversion
COG ID	[COG0372] Citrate synthase
TIGRFAM ID	[TIGR01798] citrate synthase I (hexameric type)

Plasmid Coverage information

Num covering plasmid clones	16
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	10
Fosmid unclonability p-value	0.00887444
Fosmid Hitchhiker	Yes
Fosmid clonability	hitchhiker

Sequence

Gene sequence

ATGTCGAATA AAGCGAAACT CATCATTGAA GGAAACGAGC ACGAACTGGA CATCATCGAG 
GGATCGGAAG GCGAGAAGGC CCTCGACATC CGCAAACTCC GGGCCGACAC GGGTTACATC 
ACCATGGACT CGGGCTACGC CAACACCGGC GCGGCCGAGA GCTCGGTGAC CTACCTCGAC 
GGTGAGCAGG GCGTGCTGCG CTACCGCGGC TATCCCATCG AGCAGCTGGC CGAGAACTCC 
TCGTTCACCG AGGTCGCCTA CCTGGTCATC TACGGCAAGC TGCCGAACAA GACCGAGCTG 
TCCGAATTCC GCGAGCTGCT CACCTACCAC AGCATGATCC ACGAGGGGAT GCGCCACTTC 
TTCGAGGGCT TCCCGCCGTC GGGTCATCCG ATGTCCATCC TCTCGTCGAT GGTGTGCTCG 
CTCTCGGCCT ACTACCCCGA CTGCCTCGAG ATCGACGCCG ATGACAACAT GCACGTGGCT 
CGCGTGCTAT CGAAAGTACG CACCATCGCG GCCTTTGCGT ACAAGCACTT CATCGGCCAG 
CCGATCATGT ACCCGCGCAA CGACCTCAAC TACTGCGCCA ACTTCCTGTA CATGATGTTC 
GCCGTGCCGG CCGAGCCCTA CGAGCCCAGC CCCGAGGCGG TCAAGGCGCT CAACATGCTG 
CTCATCCTGC ACGCCGACCA CGAGCAGAAC TGCTCGACCT CGACCGTGCG CCTCGTCGGC 
TCGTCCAACG CCAACCTCTA CGCCTCGATC TCGGCCGGTA TACTGGCTCT CTGGGGCCCG 
CTGCATGGCG GCGCCAACCA GGCCGTCATC GAGATGCTCG AGCAGATCCG CGACAAGGGT 
GGCGACTACA AGGGCTTCAT GCAGCGCGTG AAGGACAAGG AAGAGCGCCT CATGGGCTTC 
GGCCACCGGG TCTACAAAAA CTTCGACCCG CGCGCCAAGC TGCTGCGCAC GATGGCCGAC 
GAGCTGCTCA CCCACCTCGG CATCCAGGAC CCGCTGCTCA ACATCGCCAA AGAGCTCGAG 
CAGATCGCGC TGGCCGACGA GTACTTCATC GAGCGCAAGC TCTACCCCAA CGTCGACTTC 
TACAGCGGCA TCGTCTACCG CGCCCTGGGC ATCCCGACCA ACATGTTCAC CGTGATGTTC 
GCGCTCGGCC GCCTGCCGGG CTGGATCGCC CACTGGCGCG AGATGCACAA CGACCCGGGT 
CGCCGCATCG GCCGCCCCCG CCAGGTCTAC GTCGGCGAGC AGAAACGCGA CTACGTGCCC 
ATGGACCAGC GCAAGTAA

Protein sequence

MSNKAKLIIE GNEHELDIIE GSEGEKALDI RKLRADTGYI TMDSGYANTG AAESSVTYLD 
GEQGVLRYRG YPIEQLAENS SFTEVAYLVI YGKLPNKTEL SEFRELLTYH SMIHEGMRHF 
FEGFPPSGHP MSILSSMVCS LSAYYPDCLE IDADDNMHVA RVLSKVRTIA AFAYKHFIGQ 
PIMYPRNDLN YCANFLYMMF AVPAEPYEPS PEAVKALNML LILHADHEQN CSTSTVRLVG 
SSNANLYASI SAGILALWGP LHGGANQAVI EMLEQIRDKG GDYKGFMQRV KDKEERLMGF 
GHRVYKNFDP RAKLLRTMAD ELLTHLGIQD PLLNIAKELE QIALADEYFI ERKLYPNVDF 
YSGIVYRALG IPTNMFTVMF ALGRLPGWIA HWREMHNDPG RRIGRPRQVY VGEQKRDYVP 
MDQRK