Gene Clim_1363 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Clim_1363
Symbol
ID	6353773
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Chlorobium limicola DSM 245
Kingdom	Bacteria
Replicon accession	NC_010803
Strand	+
Start bp	1463530
End bp	1464804
Gene Length	1275 bp
Protein Length	424 aa
Translation table	11
GC content	55%
IMG OID	642668972
Product	proteinase inhibitor I4 serpin
Protein accession	YP_001943402
Protein GI	189346873
COG category	[O] Posttranslational modification, protein turnover, chaperones
COG ID	[COG4826] Serine protease inhibitor
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	24
Plasmid unclonability p-value	0.525887
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGCCCACAA CGGATACTCA TGAAAAACAT AACTTTCCCA TGAACAACAC GATTGCATTG 
CTCTCCCTGC TCGGCGTCAT GCTTACCGCA CCGCTCTCCG GCGCATCCGG AGCGACCGGT 
CTGCCTGAAA ACCATGCCGC ATCTCCGGAA GCACAAAACG AACTGGCCGT CGATCTGTAC 
CGCAATCTTG CAGTTACCGG AAAAAACCTC TTTTTCTCCC CCTCCAGCAT CGAAACCGCG 
CTTTCCATGA CCATGTCCGG AGCGCGAAAC CGGACGGAAC GGCAGATGGC CGATGTAATG 
CATGTCGGCC CTGACGCCAT GGAACGCCAC CATGCCGGAC TCGCATCGTT CGAAAAACAG 
CTTGAGTCCA TTCAGAAAAA AGGGAAGGTA ACGATAGCCT CCTCGAACTC GATCTGGCCG 
CAGAAGAACT ATCCGCTTGC GCCTTCATGG CTTGCGCAGC TCAAACGGTA CTACGGAACA 
TCGGTAACGC CGGTCGATTA CATCCATGAG ACGGAAAAAG CGCGGATCGC TATCAACCGG 
CGAGTGGAAA AGGATACGAA AAACCGGATC CGGGAGCTTC TCAAACCCGG TATTCTCGAT 
CCCCTGACAA GACTCGCGCT GGTCAATGCA GTCTATTTCA AAGGCGATTG GGAGCACCCG 
TTCAATGAAA ACAACACGGT TGCATCCCCG TTTTACATCC GCCAGGGAAC GACAGGCAAA 
GCCCCGCTGA TGCGGCAGAG TGCATCGTTC GGTTACGGCG ATCATGACGG GGTGCAGGTG 
CTCGAACTTC CCTATGCCGG AAAAAAGCTC TCCATGATCG TGGTACTGCC GAAAGAACGG 
TTCGGCCTCG AAGCTCTTGA AAAAACCCTG ACTCCGAAGC AGTTTGCCCT CTGGACGGCT 
AATCTCAGCG AGAGAAAAAT CGAAGCGCTT CTTCCCAAAT TCCGCACCAC CTCAGCGTTC 
CGCCTCGACG AGACTCTCAG GCATATGGGA ATGACCGATG CATTCGACAG GAATCTCGCC 
GATTTCAGCG GCATGGTATC CAATAGCGAC AAACTGTACA TCGGTGCGGT CGTCCACAAG 
GCTTTCGTGG ATGTCGGCGA AAAAGGCACC GAAGCTGCGG CAGCGACAGC CGTAGTCATG 
CAGCTTCGGA GCGCAATGCC GATGCCGGTA CCGGTATTCA AGGCCGACCA CCCATTCCTC 
TTTGCCATAC GGGAGAACAG CACGGGCCGC ATCCTTTTCA TGGGACGCAT TTCCGACCCT 
GCAGATAACG GATAG

Protein sequence

MPTTDTHEKH NFPMNNTIAL LSLLGVMLTA PLSGASGATG LPENHAASPE AQNELAVDLY 
RNLAVTGKNL FFSPSSIETA LSMTMSGARN RTERQMADVM HVGPDAMERH HAGLASFEKQ 
LESIQKKGKV TIASSNSIWP QKNYPLAPSW LAQLKRYYGT SVTPVDYIHE TEKARIAINR 
RVEKDTKNRI RELLKPGILD PLTRLALVNA VYFKGDWEHP FNENNTVASP FYIRQGTTGK 
APLMRQSASF GYGDHDGVQV LELPYAGKKL SMIVVLPKER FGLEALEKTL TPKQFALWTA 
NLSERKIEAL LPKFRTTSAF RLDETLRHMG MTDAFDRNLA DFSGMVSNSD KLYIGAVVHK 
AFVDVGEKGT EAAAATAVVM QLRSAMPMPV PVFKADHPFL FAIRENSTGR ILFMGRISDP 
ADNG