Gene Hhal_1814 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Hhal_1814
Symbol
ID	4711045
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Halorhodospira halophila SL1
Kingdom	Bacteria
Replicon accession	NC_008789
Strand	-
Start bp	1987564
End bp	1988667
Gene Length	1104 bp
Protein Length	367 aa
Translation table	11
GC content	70%
IMG OID	639856284
Product	chorismate synthase
Protein accession	YP_001003380
Protein GI	121998593
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0082] Chorismate synthase
TIGRFAM ID	[TIGR00033] chorismate synthase

Plasmid Coverage information

Num covering plasmid clones	23
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGTCTGGGA ATACCTTTGG CACCCTGTTT ACGGTCACCA CCTTTGGTGA GAGTCACGGC 
CCCGCGCTGG GCGGCGTGGT GGACGGCTGC CCGCCGGGGC TGGCCCTGAC CGAGGCCGAC 
CTGCAAGTCG AGCTCGATCG GCGTCGGCCC GGGCGCTCCA AGCACACCAC GCAGCGCCGC 
GAGAGCGATC AGGTGCAGAT CCTCTCCGGG GTCTTCGAGG GGGTGACCAC CGGCACCCCC 
ATCGGTCTGC TCATCGAGAA CACCGACCAG CGTTCCAAGG ATTACTCCGA GATCGCCCAG 
CGGTTCCGGC CTGGGCACGC CGACTACACC TATCAGCAGA AGTACGGGGT TCGCGATTAC 
CGCGGCGGCG GCCGTTCTTC GGCTCGGGAG ACCGCCGTGC GGGTGGCCGC CGGGGCCATC 
GCCCGCCGCT ACCTCGCCCA GCGTCTCGGT ATCGAGATCC GCGGGCGGCT GGCCCAGATG 
GGTGGGATCG AACTCGGCGC CGAGGACTGG TCGGCGGTGG ATGACAACGA CTTCTTCTGC 
GCCGACCCGG CGCGCATCCC GGAGCTCGAG GCCCTGATCC AAGAGGTGCG TAAGGCTGGC 
GATTCGGTGG GCGCTGCCGT CGAGGTCGAG GTCCGCCATG TGCCGCCGGG GCTCGGCGAG 
CCGGTCTTCG ACCGTCTGGA TGCCGACCTG GCCAAGGCGC TGATGTCCAT CAACGCCGTC 
AAGGGGGTGG AGGTCGGCGC CGGCATGGCG GCGGCAGGGC AGCGGGGCAG CGCCCATCGC 
GACGAGCTCA CCCCCGCGGG ATTCGCCGGC AACCAGTCCG GCGGGGTGCT CGGCGGGATC 
TCCAGCGGAC AGGATCTGGT GGTGCGGGCG GCGCTGAAGC CGACCTCGAG CATGCTCATC 
CCGGGGCGCT CGGTGGACGT GCACGGCGAG CCGGTCTCGG TGGTGACCAA GGGGCGCCAC 
GATCCGTGTG TCGGTATCCG TGCGGTGCCC ATCGCCGAGG CCATGGCGGC GCTGGTGGTG 
ATGGACCACT GGCTGCGGCA TCGGGCACAG AACGCCGATG TCGAGTCCGG GACCCCGGTG 
CTGCCCGCCC GCGACCGGGA GTAA

Protein sequence

MSGNTFGTLF TVTTFGESHG PALGGVVDGC PPGLALTEAD LQVELDRRRP GRSKHTTQRR 
ESDQVQILSG VFEGVTTGTP IGLLIENTDQ RSKDYSEIAQ RFRPGHADYT YQQKYGVRDY 
RGGGRSSARE TAVRVAAGAI ARRYLAQRLG IEIRGRLAQM GGIELGAEDW SAVDDNDFFC 
ADPARIPELE ALIQEVRKAG DSVGAAVEVE VRHVPPGLGE PVFDRLDADL AKALMSINAV 
KGVEVGAGMA AAGQRGSAHR DELTPAGFAG NQSGGVLGGI SSGQDLVVRA ALKPTSSMLI 
PGRSVDVHGE PVSVVTKGRH DPCVGIRAVP IAEAMAALVV MDHWLRHRAQ NADVESGTPV 
LPARDRE