Gene CBUD_0449 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	CBUD_0449
Symbol
ID	5459199
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Coxiella burnetii Dugway 5J108-111
Kingdom	Bacteria
Replicon accession	NC_009727
Strand	-
Start bp	430207
End bp	431577
Gene Length	1371 bp
Protein Length	456 aa
Translation table	11
GC content	46%
IMG OID
Product	carboxy-terminal processing protease precursor
Protein accession	YP_001423867
Protein GI	154706287
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	15
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAGCCTAA AAAGAAAGAT TATAGCTATC GTAGTTGCTG CCTTCATCAG TCCGGGACTT 
ACCACCGTAT TCGCTTTTTC TCCTCCTTTT TTACCGAAAA CGCTGATCTC CACTCCAGCA 
GAAGATAAAA ACGATGAGCT CTCCAGAAAA GACGTCGAAC GTTTCGTGAC GGCCATTGCA 
TTGGTCCATC AGTATTACAT TAAAAATGTG AGTAATAAAA AATTACTCGA CAGCGCAATT 
AGCGGCATGA TGGCCAACCT CGACCCACAT TCTAGTTATC TCGACAACAA CGACTTGAAA 
GAATTGAAAA CCACCGTCTC TGGAGAGTTT GTGGGCGTTG GCATCGAGCT CACGGTCTCC 
AAAGACGGTC TTTTAAAAGT CATCAGCCCG CTGGAAGATT CCCCCGCCGC GCGCGCGGGC 
ATCCAACCCA ACGATTATAT TGTTAAAATT GACGACCAAT TAGTCCAAAA CATGAGTCTT 
CCGGAAGCGG TGAGCCGAAT TAAAGGCAAA AAAGAGACGA CCGTCAAGTT AACGGTTTTA 
CGCAAAAGTG CAAATAAGCC TTTAATTTTT TCGATTCAAC GTGAACCCAT TCATTTGGTT 
AGTGTAAAAA GCAAAACTTT AGAACCCGGT TACGGTTATG TCCGAATCAC TTTCTTCCAA 
GGGCCCGTGG AAAACCAGTT GCGTGATGCG ATTGATAAAT TGAAAAAAGA ATCGCAAGGT 
CCTTTGAAAG GTTTAGTCCT CGATCTGCGT AATAATCCCG GCGGCCTGCT CGATGTCAGC 
GCCCAAGTGG CGGACAGTTT CCTTGATGCG AGTAAGATGC ACCGCTATAA CGACCTCATC 
GTTTACACAA AAGGACGCGT TCCGGGTGCC GATATTCAAA TCAAAGCGAC GCCTGGCGAT 
CTCATTCCCC ACACACCGAT GGTCGTACTG ATCAACGGCG GATCGGCCTC TGCTTCAGAA 
ATTGTGGCTG GCGCTCTTCA AGATTACAAA CGCGCTATTA TCATGGGAAC ACCCAGCTTC 
GGGAAAGGGT CGGTCCAAAC CGTTTTACCC ATTGGGAAAG AGGACGCGAT TAAACTAACG 
ACTGCTTTGT ATTACACCCC GGCAGGCCGC GAAATTCAGG CCAAAGGCAT TATACCGAAT 
GTTGCGGTTC CGGAATTCAG TATTACGCCT CCTAAATCAC AGTTAACATT GGATGAAGCC 
GATTTCCAAA ACCATTTGCC CAATGACGGC GCGGCTTCCA CTAAGGCAAA TCCCACAACG 
GCCGAAGAAG AGAAAAATTT ATTACAAACC CAACTGCAAT TGGCGAAAAC CGATTATCAG 
CTATATCAAG CTTTAATGAT GTTACAAGGT CTTCAGGTGG TTAAGCATTA G

Protein sequence

MSLKRKIIAI VVAAFISPGL TTVFAFSPPF LPKTLISTPA EDKNDELSRK DVERFVTAIA 
LVHQYYIKNV SNKKLLDSAI SGMMANLDPH SSYLDNNDLK ELKTTVSGEF VGVGIELTVS 
KDGLLKVISP LEDSPAARAG IQPNDYIVKI DDQLVQNMSL PEAVSRIKGK KETTVKLTVL 
RKSANKPLIF SIQREPIHLV SVKSKTLEPG YGYVRITFFQ GPVENQLRDA IDKLKKESQG 
PLKGLVLDLR NNPGGLLDVS AQVADSFLDA SKMHRYNDLI VYTKGRVPGA DIQIKATPGD 
LIPHTPMVVL INGGSASASE IVAGALQDYK RAIIMGTPSF GKGSVQTVLP IGKEDAIKLT 
TALYYTPAGR EIQAKGIIPN VAVPEFSITP PKSQLTLDEA DFQNHLPNDG AASTKANPTT 
AEEEKNLLQT QLQLAKTDYQ LYQALMMLQG LQVVKH