Gene Haur_4146 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Haur_4146
Symbol
ID	5736007
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Herpetosiphon aurantiacus ATCC 23779
Kingdom	Bacteria
Replicon accession	NC_009972
Strand	+
Start bp	5294260
End bp	5295387
Gene Length	1128 bp
Protein Length	375 aa
Translation table	11
GC content	55%
IMG OID	641281300
Product	citrate (Si)-synthase
Protein accession	YP_001546906
Protein GI	159900659
COG category	[C] Energy production and conversion
COG ID	[COG0372] Citrate synthase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	14
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGCGACTG AAACCCAAGT TCATGTAGGT TTAGAAGGGA TCGTTGCAGC GGCAACGCGG 
CTCAGCAGTG TCGATGGCCA AGCTGGGGAA TTAATTATTG CAGGCTTTCC CTTGGAGCGT 
TTGGCCCCGT TTGCGACCTT CGAGGAAACG ATTTTTCTCT TGTGGAATGA CCATTTGCCA 
AGCCAAAGCG AGTTGGCCGA ATTGCGCCAG AGCCTTGCCA GCCAGCGCCA ATTGCCAGCC 
CTTACCTTAG AAGTCGCTCA ACAGCTGGGC CGCGAACAGG CCGACCCGAT GGATGCATTG 
CGGGCTGCGA CCGCTACATT AAACCCATTG GCTGACGAAA AAGCTACGGC CCAACGAATT 
GTGGCAGCCT TGCCCACGAT TGTGGCGGCC TATTGGCGAG CACGCAACCA AGCCGAATTT 
ATCGAGCCAC GCAGCGATTT AAGCCATGCT GCCAATTATT TGTGGATGTT GACTGGCAAA 
GAGCCAAGCG CTGAGAAGGT GCGGGCACTC GAAACCTATC TCAACACCGT AGTTGACCAT 
GGCCTGAATG CCTCGACCTT CACTACTCGC GTGATCATCT CGACTGAATC GGATTTGGTT 
TCGGCGATTA CTGGGGCGAT TGGAGCGCTC AAAGGGCCGT TGCATGGCGG CGCACCTGGC 
CCAGCCTTGG ATATGGTATT TGAAATTGGC ACAGCCGATC GCGCTGAGGA AGTACTTCGC 
GCCAAGTTAG CACGCGGCGA GCGCTTGATG GGCTTTGGCC ATCGCGTCTA CAAGGTGCGC 
GATCCACGGG CCGAGGTTTT GGCAGGCGCA GCCGATCAAC TTTTTGCCAA CGATGGCAAC 
CGCGAGTTAT ACGAACTTGT ACGCCATGTT GAGCAAACCG CGATTCGGCT GCTCGAAGAA 
CACAAGCCAG GCCGCAAATT GCAAACCAAT GTCGAGTTCT ACACTGCCTT GCTGTTGCAT 
GGCATCGATT TTGAAACCGA CCTGTTTACC CCAACCTTTA CGATCAGCCG CGCTGTTGGT 
TGGATTGCCC ACGCCTTCGA GCAACGCGCC GTTGGCCGAA TTATTCGCCC ACAATCGATT 
TATACTGGCG AACGCAACCG CACGTGGGTT GAGGTTGCCG AGCGGTAA

Protein sequence

MATETQVHVG LEGIVAAATR LSSVDGQAGE LIIAGFPLER LAPFATFEET IFLLWNDHLP 
SQSELAELRQ SLASQRQLPA LTLEVAQQLG REQADPMDAL RAATATLNPL ADEKATAQRI 
VAALPTIVAA YWRARNQAEF IEPRSDLSHA ANYLWMLTGK EPSAEKVRAL ETYLNTVVDH 
GLNASTFTTR VIISTESDLV SAITGAIGAL KGPLHGGAPG PALDMVFEIG TADRAEEVLR 
AKLARGERLM GFGHRVYKVR DPRAEVLAGA ADQLFANDGN RELYELVRHV EQTAIRLLEE 
HKPGRKLQTN VEFYTALLLH GIDFETDLFT PTFTISRAVG WIAHAFEQRA VGRIIRPQSI 
YTGERNRTWV EVAER