Gene Clim_2455 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Clim_2455
Symbol
ID	6354725
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Chlorobium limicola DSM 245
Kingdom	Bacteria
Replicon accession	NC_010803
Strand	-
Start bp	2688980
End bp	2690365
Gene Length	1386 bp
Protein Length	461 aa
Translation table	11
GC content	47%
IMG OID	642670044
Product	hypothetical protein
Protein accession	YP_001944454
Protein GI	189347925
COG category
COG ID
TIGRFAM ID	[TIGR03296] M6 family metalloprotease domain

Plasmid Coverage information

Num covering plasmid clones	8
Plasmid unclonability p-value	0.0000334533
Plasmid hitchhiking	Yes
Plasmid clonability	hitchhiker

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGCCGCTTA TTCTCGCTTG CTTTCTCGTC GTAAGTCGTG TGGTTTTAGC GAAAAGTACG 
GCAGAGGAAG TCGGCCTGGG GCCGCAGTCA ACACAGGCTG TCGGGAATAA GCGGGTTCTG 
ATGGTTGTTG TACGGTTTCC TGATGCAGCG CCGACAACCC CAATCGAGGT TGTAAAGAAA 
AAGGTTATTG AAGGACTCGG TTCGTATGTT GACGAACAGT CGTATGGACT TGCTTCTATA 
ACAGCCGATT TCAGGGGGTA TGTTATGTTG CCCGATGCAC TCGCAGACTA TAGGGTAAGT 
CCCTATAATT TCCGTGTGGA CAAAACAAGA ATTCGCAAAC TTATTGGCGA CACCATGACC 
GCCATAGAGA AGGATACTGA TTTTTCGGCC TACGATCACT TCATGATAGT ACCCGCGGTA 
CACACCATGC CAGGACAAGG GTATGGGATG ATCTGTTACT GCGCAAATCC TGGTATGCTT 
TCAGGTGTTA CAAAGGGATA TGTTCCTCGG TATGTAACCA TGAAATCGGC AGGAGGAAAA 
GAGTTTAGCG GCGGGATTTT TGTAGGGGCA GAGAATGCGA ATATCGGCAT GTTCGCACAT 
GATTATTTTC ATGTTCTGGC AGGGGTTCAT GACGGGAGGC GACTCGTGCC CTGTCTCTAT 
AATTATAAGC TGCAGTCCGA TGCTTCAGCA GGTCTCCCCT CATTTGAACA TCATGCTACC 
TATATGGGAC TTTGGGACAT TATGTCGCAG CATTTTGTAA AAAAGGGAGA GCCTCCTCAA 
GGAACATCGT CGTTTACTAA AATAAGGCTT GGCTGGATCA AGAAGCATCA GGTTCGGATT 
GTAAAACCTG GCGCAACCGA TTTCACCCTG CTTGCGCCTC TCTCAAAAGG AGGTCAATTA 
CTTGCGGTCA AGATACCGTT AGACGACGGG TCGTATTATC TTGTGGAGAA CAGGCAACCA 
ATAGGATTTG ACAGGATGCT TCCTGATTCG GGAATAATTG TGCTGAAAGT AAATCCTGTG 
GCTGATGAGG GATATGGTAC AGTAGAAGTT CTCTGTGCTG CGGGGGCAGG CAATTTTATG 
GAGGCGACCT ACAGGCTGGA GGCAAGCAAA AGGGATTGTT TTGTCGACGA AAGAAATAAT 
GTTACGATAC TGCCCTTATG GAAGCAGCAC GAACATGTCG GGGTGCTGAT CACAACGTCA 
GAACATCGTG AAGCTGCGGG TAAAGCTGCT CGGGCTATAC AGGCTCTTAT CGATCAAACC 
GCCGTGACAA AGGACAATAC AATGGAAACG GTAATTCTTG AAGCTGTTAC TGCGTTCAGG 
AATAATGAAT TTGAAAAAAG CTATACTATT GCCATCAAAA AGAACGGAAA GGATATCCGC 
CATTGA

Protein sequence

MPLILACFLV VSRVVLAKST AEEVGLGPQS TQAVGNKRVL MVVVRFPDAA PTTPIEVVKK 
KVIEGLGSYV DEQSYGLASI TADFRGYVML PDALADYRVS PYNFRVDKTR IRKLIGDTMT 
AIEKDTDFSA YDHFMIVPAV HTMPGQGYGM ICYCANPGML SGVTKGYVPR YVTMKSAGGK 
EFSGGIFVGA ENANIGMFAH DYFHVLAGVH DGRRLVPCLY NYKLQSDASA GLPSFEHHAT 
YMGLWDIMSQ HFVKKGEPPQ GTSSFTKIRL GWIKKHQVRI VKPGATDFTL LAPLSKGGQL 
LAVKIPLDDG SYYLVENRQP IGFDRMLPDS GIIVLKVNPV ADEGYGTVEV LCAAGAGNFM 
EATYRLEASK RDCFVDERNN VTILPLWKQH EHVGVLITTS EHREAAGKAA RAIQALIDQT 
AVTKDNTMET VILEAVTAFR NNEFEKSYTI AIKKNGKDIR H