Gene COXBURSA331_A1383 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	COXBURSA331_A1383
Symbol	gcp
ID	5793581
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Coxiella burnetii RSA 331
Kingdom	Bacteria
Replicon accession	NC_010117
Strand	-
Start bp	1266276
End bp	1267295
Gene Length	1020 bp
Protein Length	339 aa
Translation table	11
GC content	47%
IMG OID	641330795
Product	putative DNA-binding/iron metalloprotein/AP endonuclease
Protein accession	YP_001597090
Protein GI	161830455
COG category	[O] Posttranslational modification, protein turnover, chaperones
COG ID	[COG0533] Metal-dependent proteases with possible chaperone activity
TIGRFAM ID	[TIGR00329] metallohydrolase, glycoprotease/Kae1 family

Plasmid Coverage information

Num covering plasmid clones	38
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAAATGTG TCCTTGGTGT TGAAACTTCC TGTGATGAAA CTGCTGTTGC GCTGTATGAT 
GGTGAGCGAG GATTATTAGC GCACCGTGTT TATAGTCAAA TAGCCATCCA CGCTGAGTAT 
GGCGGTGTGG TTCCTGAGCT TGCTTCGCGC GATCACATTA GAAAAATTTT GCCTCTAATT 
AAAGCCGCTT TGGATGACGC TGCCTTGTCC AAAGAAAACA TTGACGGAAT TGCTTACACA 
AAAGGCCCTG GTTTAATCGG GGCGTTGATG GTAGGGGCGT CGGTGGCAAA AAGCTTAGCG 
TATGCCTGGC GGGTGCGGGT CGTGGGTGTG CACCATATGG AAGCGCATTT AATGGCGGTG 
CAATTAGAAG AAAGCCGACC TGCGTATCCG TTTATTGCCT TATTGGTTTC GGGGGGCCAC 
ACGATGTTGG TTCACGTCGA GCAGCCAGGC CGCTATAAAA TCTTGGGAGA AAGCGTTGAT 
GATGCTGCGG GAGAAGCGTT TGATAAAACA GCTAAATTAT TAGGGCTGCC CTATCCCGGT 
GGTCCCGCGC TGGCTCGCTT AGCAGAGCAA GGCGAACCTA AACGTTTTAT TTTTCCACGG 
CCAATGGTGA ATCAACCACA TCTTAATTTT AGTTTTAGCG GCTTAAAGAC ACACGCGGTT 
AATTGTTTTA AACAATACGG TGGTGAGGAA CAAACCCGAG CGGATATTGC TTGCGCGTTT 
GAGAACGCGG TCGTCGATAC TTTAATTATT AAATGTTTAC GAGCCTTGGA AAAAACAGGA 
ATTAATACTT TGGTTTTAGT CGGTGGCGTC GCGGCAAACA AGAAATTGCG TGAACGATTG 
GGACAAGTTG CCGTAAAGCG AGCCGCACAA ATTTATTACC CCCGTCAAGA ATTTTGTACG 
GATAACGGCG CGATGGTCGC TTATACAGGC TGGCTGCGGT TAAACGCTGG CGAAAAAGAA 
GATAAAATAA TTCGCGTTAA ACCAAGATGG TCGATGGCTG AATTAAATAT AATAAACTAG

Protein sequence

MKCVLGVETS CDETAVALYD GERGLLAHRV YSQIAIHAEY GGVVPELASR DHIRKILPLI 
KAALDDAALS KENIDGIAYT KGPGLIGALM VGASVAKSLA YAWRVRVVGV HHMEAHLMAV 
QLEESRPAYP FIALLVSGGH TMLVHVEQPG RYKILGESVD DAAGEAFDKT AKLLGLPYPG 
GPALARLAEQ GEPKRFIFPR PMVNQPHLNF SFSGLKTHAV NCFKQYGGEE QTRADIACAF 
ENAVVDTLII KCLRALEKTG INTLVLVGGV AANKKLRERL GQVAVKRAAQ IYYPRQEFCT 
DNGAMVAYTG WLRLNAGEKE DKIIRVKPRW SMAELNIIN