Gene Cpha266_1902 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Cpha266_1902
Symbol
ID	4570861
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Chlorobium phaeobacteroides DSM 266
Kingdom	Bacteria
Replicon accession	NC_008639
Strand	-
Start bp	2208815
End bp	2210074
Gene Length	1260 bp
Protein Length	419 aa
Translation table	11
GC content	49%
IMG OID	639766484
Product	Ste24 endopeptidase
Protein accession	YP_912342
Protein GI	119357698
COG category	[O] Posttranslational modification, protein turnover, chaperones
COG ID	[COG0501] Zn-dependent protease with chaperone function
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	7
Plasmid unclonability p-value	0.0130115
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGATGAATG GTTTCGGACA GGTTGTTTTG TTTACCCTTG TATTGACTTT TTTCCTCAAG 
CTTATTGCTG ATCTGCTGAA CCTCCGGGCT TCCGAGAGCG GGCTTCCGCC GGAGTTTCAG 
GGGGTGTATG AAGAGGATGC CTACAGGAAA TCCCAGGACT ATCTGCGGGC AACAACCCGT 
TTTTCGCTTA TCGGGGCTTT TGTCGATCTT CTTTTTCTGC TTGTTTTCTG GTTTGCCGGA 
GGGTTCAATA TGCTCGACCA GCTTTTGCGC GCACAGGGAT ATAACACGGT GCTTACAGGC 
GTGCTCTATA TCGGCGCTCT CTTGCTCCTG CAGGGGATTC TCGGCCTTCC CTTTACCCTT 
TACAGGACAT TTGTTATCGA GGAGAGGTTT GGATTCAACA AAACCACACC GAAAGTTTTT 
GTTGCTGATC TCCTGAAAAC CCTTTTTCTT GCCCTGCTCA TCGGTACTCC CGTTCTTGCC 
GCTCTGCTCT GGTTTTTTGA ACAGGCAGGC CCGTTTGGAT GGCTCTGGGC CTGGGGCGGG 
TTGACGCTCT TCACCCTTCT CTTGCAGTAT GTCGCTCCTG CCTGGATCAT GCCGATTTTC 
AACAAGTTTG TTCCGCTTGA AGAAGGCGAG CTGAACAATG CCATTATGCA ATATGCCCGA 
ACGGTCGGAT TTCCGCTAAC CGGTATTTAC GTGATTGATG GGTCGAAGCG ATCATCGAAA 
GCAAATGCGT TTTTTACCGG ATTCGGCAAA CGCAAGAGAA TTGCCCTGTT TGATACGCTT 
GTCAGCAACC ATAGCGTCAG TGAGCTTGTT GCTGTGCTTG CGCACGAAAT AGGTCATTAC 
AAGAAAAAGC ATGTGCTCAT CAATATGGTG CTCAGCATGG TGAATCTCGG TGTTGTCTTT 
TATCTCCTCT CGGTGTTCAT GAACAATCCT GATCTCTTCA GTGCTTTTTT CATGCAGGAT 
ATTTCAGTCT ACGGCAGCCT TGTTTTTTTC CTTCTGCTCT ACAGTCCGGT TGAGTTCGTT 
CTTTCCATTC TGCTTCAGGC GCTGTCGCGC AAGCATGAGT ATGAGGCCGA CAGCTTTGCC 
GTATCAACAT ACAGCGACGG ATTCGCGCTC GGAGAGGCTC TTAAAAAGCT TTCGCGCAGC 
AATCTTTCAA ACCTGACGCC TCATGCGCTC TATGTTTTTC TCAACTATTC GCATCCTCCG 
GTTGTGCAGC GTATCAGACG AATAAATGAA CATCCTGCCC CCGGTCATCT CAACCATTGA

Protein sequence

MMNGFGQVVL FTLVLTFFLK LIADLLNLRA SESGLPPEFQ GVYEEDAYRK SQDYLRATTR 
FSLIGAFVDL LFLLVFWFAG GFNMLDQLLR AQGYNTVLTG VLYIGALLLL QGILGLPFTL 
YRTFVIEERF GFNKTTPKVF VADLLKTLFL ALLIGTPVLA ALLWFFEQAG PFGWLWAWGG 
LTLFTLLLQY VAPAWIMPIF NKFVPLEEGE LNNAIMQYAR TVGFPLTGIY VIDGSKRSSK 
ANAFFTGFGK RKRIALFDTL VSNHSVSELV AVLAHEIGHY KKKHVLINMV LSMVNLGVVF 
YLLSVFMNNP DLFSAFFMQD ISVYGSLVFF LLLYSPVEFV LSILLQALSR KHEYEADSFA 
VSTYSDGFAL GEALKKLSRS NLSNLTPHAL YVFLNYSHPP VVQRIRRINE HPAPGHLNH