Gene Hhal_2121 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Hhal_2121
Symbol
ID	4709751
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Halorhodospira halophila SL1
Kingdom	Bacteria
Replicon accession	NC_008789
Strand	+
Start bp	2323900
End bp	2324919
Gene Length	1020 bp
Protein Length	339 aa
Translation table	11
GC content	71%
IMG OID	639856595
Product	KpsF/GutQ family protein
Protein accession	YP_001003687
Protein GI	121998900
COG category	[M] Cell wall/membrane/envelope biogenesis [T] Signal transduction mechanisms
COG ID	[COG0794] Predicted sugar phosphate isomerase involved in capsule formation [COG2905] Predicted signal-transduction protein containing cAMP-binding and CBS domains
TIGRFAM ID	[TIGR00393] KpsF/GutQ family protein

Plasmid Coverage information

Num covering plasmid clones	20
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGACTCCCA TGCGCACCCT GATCGAACGA CACCTCGGGG CCCCGGACGC GGGGGACGAA 
CGCCTCCAGG CCCTCGGCCG CGCGGTCCTG CAGCTGGAGG CCGACGCCGT CGCCGCCCTC 
GGCGAGCGCA TCGATCAGCC CTTCAGCGAG GCGTGCCGCC ATATGCTCGC CTGCCGCGGC 
CGGGTGATCG TCACCGGCAT GGGCAAGTCC GGACACATCG GCTCGAAGAT GGCGGCCACC 
CTGGCCAGCA CCGGCACGCC GGCGTTCTTC GTCCACCCCG GTGAAGCCAG CCACGGCGAT 
CTGGGCATGG TCACCGCCGA CGACGTCGTG GTAGCCCTGT CCAACTCCGG CGAGACCGAT 
GAGCTCACCG CCATCGTGCC GCTGATCAAG CGCCTGGGCG TGCCCCTGAT CGCCCTCACC 
GGCCGCCCGG GCTCGACCCT GGCCCAGGCG GCCTCGGTCC ACCTGGATGT GAGCGTCGAG 
CAGGAGGCCT GCCCCCTGGG GCTGGCCCCC ACCGCCAGCA CCACCGCCAG CCTGGCCATG 
GGCGACGCCC TGGCCGTGGC ACTGCTCGAT GCCCGCGGCT TCACCGCGGA AGACTTCGCC 
CGCTCCCACC CCGGGGGCAA ACTGGGGCGC CGACTGCTGC TGCACATCGA CGACATCATG 
CAGACCGGCG AACGCGTCCC ACGGGTCCAA CCAGGCACCC CACTGCGCGA CGCCCTGCTG 
GAGATCAGCC GCAAGGGGCT GGGCATGACC GCCATCGTCG ACGAGCAGCA CCGCGTACTA 
GGCATCTTTA CCGACGGCGA CCTGCGACGG ACCCTGGACC GCGGCGCCGA CATCCACCAG 
ACCCCCATCG AGGCCGTGAT GACCCCGAGC CCACAAACCG CCTCGCCGGA CCTGTTGGCC 
GCCGAGGCAG CCGAGCGCAT GGAGCGCCAC CGCATCAACG GCCTACTGGT CACCGATGCC 
GAGGGCCGAC TCGTCGGCGC CCTGAACATG CACGACCTGC TGCGCGCCGG AGTCGTATGA

Protein sequence

MTPMRTLIER HLGAPDAGDE RLQALGRAVL QLEADAVAAL GERIDQPFSE ACRHMLACRG 
RVIVTGMGKS GHIGSKMAAT LASTGTPAFF VHPGEASHGD LGMVTADDVV VALSNSGETD 
ELTAIVPLIK RLGVPLIALT GRPGSTLAQA ASVHLDVSVE QEACPLGLAP TASTTASLAM 
GDALAVALLD ARGFTAEDFA RSHPGGKLGR RLLLHIDDIM QTGERVPRVQ PGTPLRDALL 
EISRKGLGMT AIVDEQHRVL GIFTDGDLRR TLDRGADIHQ TPIEAVMTPS PQTASPDLLA 
AEAAERMERH RINGLLVTDA EGRLVGALNM HDLLRAGVV