Gene Haur_2007 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Haur_2007
Symbol
ID	5733896
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Herpetosiphon aurantiacus ATCC 23779
Kingdom	Bacteria
Replicon accession	NC_009972
Strand	+
Start bp	2486215
End bp	2487498
Gene Length	1284 bp
Protein Length	427 aa
Translation table	11
GC content	50%
IMG OID	641279151
Product	citrate synthase I
Protein accession	YP_001544778
Protein GI	159898531
COG category	[C] Energy production and conversion
COG ID	[COG0372] Citrate synthase
TIGRFAM ID	[TIGR01798] citrate synthase I (hexameric type)

Plasmid Coverage information

Num covering plasmid clones	27
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

GTGACTAACA GCTTGACGAT CACCGATAAT CGTACTGGGA AAACTTACGA ATTGCCCATC 
GTCGATGGCA CCATCCGCGC CCTCGACTTA CGTCAGATCA AAGCAGATGC CGAAGATTTT 
GGGCTGATGA CCCACGACCC AGGCTTCAAT AACACCTCAT CATGCCGTAG CTCAATTACC 
TATATCGATG GCGACGCTGG GATTCTGCGC TATCGCGGCT ACCCAATTGA GCAATTGGCT 
GATAGCAGCA GCTACCTCGA AACCGCCTAC TTGATTCTCA ATGGAGAACT GCCAACCAAA 
CCACAACTTG ATGCATGGGT TCATGAAATT ACCCACCGCA CAATGGTGCA TGAAAATATC 
AAGAAGTTAA TGGATGGCTT TCATTTTGAT GCCCACCCCA TGGGGATGTT GATTAGTACC 
TTGAGTGCAA TGTCAACCTT CTATCCTCAA GCCAAAAACG TCAAAGATCC AGCAATGCGC 
CGTTTGCAGA TTGCTCGCTT GATCGCCAAA GTGCCAACGA TCTCGGCCTA TGCCTATCGC 
AAACGTATGG GCTTGCCCTA CGTTTACCCC GATAACTCGT TGAGCTATAC TGGCAACTTC 
TTGAAGATGA TGTTCCAAAG AGCTGATCCA TACATTCCAG ACCCAATTAT GGAAAAAGCC 
TTGGATGTTT TGTTCGTTTT GCATGCCGAC CACGAGCAAA ATTGTGGCAC GAATGCGATG 
CGCTCAGTGG GTAGCTCAAA CGTCGATCCC TATTCAGCCA TGGCTGGGGC GGCGGCAGCC 
TTGTATGGTC CGCTGCATGG CGGCGCAAAC GAGCAAGTGC TGCGCATGTT GCAAGAAATC 
GGTTCCGCCA GTAATGTTGC CGATTACATC CGCCGCGTCA AAAATCGTGA AGTCTTGTTG 
ATGGGCTTCG GCCATCGCGT CTACAAGAAC TACGATCCTC GCGCTGCGAT CGTCAAGCAG 
CTGGCCTACG ATGTGTTTGA AGTTGTTGGG CGTAACCCAA TGATCGACAT TGCCTTGGAA 
CTTGAAAAGA TTGCGCTCGA AGATGATTAT TTCGTCTCAC GCAAGCTGTA CCCCAATGTC 
GATTTCTACA CGGGCATTAT TTACCAAGCA ATGAAATTCC CTGTTGATAT GTTCCCAGTG 
CTGTTTGCCA TCCCTCGCAC GGTCGGTTGG TTGGCCCAGT GGGATGAAAT GCACAACGAC 
AAGGAAACTT CAATTGCTCG CCCACGCCAG ATCTACACTG GCTACGATGC TCGCGATTTC 
GTTCCAGTCG AAAAACGCGG CTAA

Protein sequence

MTNSLTITDN RTGKTYELPI VDGTIRALDL RQIKADAEDF GLMTHDPGFN NTSSCRSSIT 
YIDGDAGILR YRGYPIEQLA DSSSYLETAY LILNGELPTK PQLDAWVHEI THRTMVHENI 
KKLMDGFHFD AHPMGMLIST LSAMSTFYPQ AKNVKDPAMR RLQIARLIAK VPTISAYAYR 
KRMGLPYVYP DNSLSYTGNF LKMMFQRADP YIPDPIMEKA LDVLFVLHAD HEQNCGTNAM 
RSVGSSNVDP YSAMAGAAAA LYGPLHGGAN EQVLRMLQEI GSASNVADYI RRVKNREVLL 
MGFGHRVYKN YDPRAAIVKQ LAYDVFEVVG RNPMIDIALE LEKIALEDDY FVSRKLYPNV 
DFYTGIIYQA MKFPVDMFPV LFAIPRTVGW LAQWDEMHND KETSIARPRQ IYTGYDARDF 
VPVEKRG