Gene Cphamn1_1988 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Cphamn1_1988
Symbol
ID	6375680
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Chlorobium phaeobacteroides BS1
Kingdom	Bacteria
Replicon accession	NC_010831
Strand	-
Start bp	2135481
End bp	2136611
Gene Length	1131 bp
Protein Length	376 aa
Translation table	11
GC content	49%
IMG OID	642684479
Product	hydroxyneurosporene synthase
Protein accession	YP_001960380
Protein GI	189500910
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	7
Plasmid unclonability p-value	0.0180674
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	7
Fosmid unclonability p-value	0.149508
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAACATCA CTACAGAACT GGATCGGGAT ATCTGGCATA ATCTTCAGGA GCCCGGTTCC 
TATGAGTGGT GGTATTTCGA CGCGGAAGAT GAAGAACAGG GTATTTCCCT TGTCTGTATA 
TGGTTTGCCG GTTTTGCTTT CTCCCCGTAC TATATGGAGC ACTATCTGGG CTGGAAACAG 
AACAGACTCG CCATTTCTCC GAAAGCACTC GATTACTCCG CATTCAGCTT TCAACTCTAC 
GAAAACGGAC GTGAAAGCAT TAATTTCATC AAAGAAGGGC CCTCCTCACT CTTTGAGAGC 
AGCGGAAACG ATATCGATGT CCGCTTTGAG CGTAACCGAT TCTTTTATGA CTCTCAGCGG 
CAGTCCTATG TACTCGATGT GGCGTTTGAT TTTCCTGCAC GCCGCAAGAA AATCGCCGCC 
AAACTGGTTT TCAGCGTCAG GCACCGGTAT TCCTACAGAA AAACAGACGG GAACAACAAC 
GGGAACGTTC CGCATCACGA ATGGCTGCTG ACGCTTCCAA GAGCGGATGT GACCGGTTCG 
CTCACCCTTG GCGATACGCT CAGAAAACAA TCCCGCACGC TTGAGTTTCA CGGAAGAGGA 
TATCATGATC ACAATCTCGG TACCATGCCG GTGCATGAAT ATATCGATAC GTGGTACTGG 
GGGCGGGCAT TTTCCGAGGA ATACGACCTC ATCTACTATA TGATTTTTTT TAAAAATTCC 
GCTTACCGAC CGCTTACACT CTGTATGCTG CGCGATAACG GCACCGGAGA TCTCACGGTG 
TATGAAGATC TGCGTATCGA CAAGTCAGGG CTGAGGCGCG GTTTGTTCGC TCCTGTACAC 
AACAGGAATC TCGGTTTTTC CTGTGATGAT TTTCGTGTCG ATATCCGTCA GAGGCAGGTT 
CTTGATTCAG GCCCGTTTTA TCTGCGATAC AGTTCGAATA TCGTGTTTCA GAAAGGTGGC 
CTTGAATGCA CCTCCCTGAG AGGAATATCG GAATTTCTCA GTCCCGGACG GCTTGAGATG 
TCGGCGCTCA GGTTTTTTAT CCGATGCAGG GTCTGGCGCC ACGGGGTCAG GTCTGCGATG 
TACGGGATGT ATAATTTTTT CAAAACCTGT TTGCATTGGA TTAAAAGGTA A

Protein sequence

MNITTELDRD IWHNLQEPGS YEWWYFDAED EEQGISLVCI WFAGFAFSPY YMEHYLGWKQ 
NRLAISPKAL DYSAFSFQLY ENGRESINFI KEGPSSLFES SGNDIDVRFE RNRFFYDSQR 
QSYVLDVAFD FPARRKKIAA KLVFSVRHRY SYRKTDGNNN GNVPHHEWLL TLPRADVTGS 
LTLGDTLRKQ SRTLEFHGRG YHDHNLGTMP VHEYIDTWYW GRAFSEEYDL IYYMIFFKNS 
AYRPLTLCML RDNGTGDLTV YEDLRIDKSG LRRGLFAPVH NRNLGFSCDD FRVDIRQRQV 
LDSGPFYLRY SSNIVFQKGG LECTSLRGIS EFLSPGRLEM SALRFFIRCR VWRHGVRSAM 
YGMYNFFKTC LHWIKR