Gene COXBURSA331_A0438 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	COXBURSA331_A0438
Symbol	thiO
ID	5794079
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Coxiella burnetii RSA 331
Kingdom	Bacteria
Replicon accession	NC_010117
Strand	+
Start bp	374752
End bp	375774
Gene Length	1023 bp
Protein Length	340 aa
Translation table	11
GC content	41%
IMG OID	641329960
Product	glycine oxidase ThiO
Protein accession	YP_001596279
Protein GI	161831570
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0665] Glycine/D-amino acid oxidases (deaminating)
TIGRFAM ID	[TIGR02352] glycine oxidase ThiO

Plasmid Coverage information

Num covering plasmid clones	23
Plasmid unclonability p-value	0.017801
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAAAATGA AAGTAGGCAT TGCGGGGGCA GGATTACTGG GGCGTTTATT AGCTTGGCAA 
TTAAGTAAAG TGGGCTTTGG GGTTACGCTA TTTGATAAAG ATGATAAAAG TGGTCAAAAG 
AGCACGGCCT ATGCAGCGGC TGGGATGCTG TCACCCGTGG CTGAGTGTGA AATAGCAGAG 
CAGATAATTT TTAATTTAGG AAGTTATTCA TTAAGGAAAT GGCCACTGTG GTTATCATCA 
TTGAACCAAC CTGTTTATTT TAAACAAAAT GGAAGCATTG TAATTTCGCA TTCACACGAT 
GAGGTAGAAA AAGAGCGCTG GTTGAAACAA ATAAGTCGTA AAATAAAAGA TTTCTCTCTT 
GAAAAATTAT CATCTTCTGC ACTCCAACGA TTGGAGCCCG AATTAAATTT TGATGAAGGG 
TATTATTTGC CGCAGGAAGC ACACCTAGAT TCACGTGCAC TTATGCAGAC CTTAGAAAAA 
GAATTAAACG TGGAATGGCA TTCGAAAACC TTTGTGGAGA GCGTGGTTCC TTATCGTATC 
TTAACGAAAG GAAAATCATA CCAATTTGAT TGCATATTCG ATTGTCGTGG CACAGGCGCA 
GGAGAAATGT TTTCCGATTT GCGTTCGGTA CGTGGCGAGT TAATTTATTT GCATGCACCC 
GATGTGCGTT TAAATCGTCC CATTCGATTA CTTCATCCGC GTTATCGACT TTATATTGTT 
CCTCGCGCGC ATCATATTTA TCTTATTGGT GCGAGTGAAA TTGAGTCCAA TGATATTTCA 
CCAATTTCTG TGCGTACGTG TTTGGAATTA TTATCGGCAG TTTATAGTGT ACACCCTGCA 
TTTGCAGAAG CGCGGATCAT TGAAACGGTT ACCGCCCTAC GACCGGCGTT ATCGGATAAC 
TTACCTCGTA TTCACTACCA GCCTGGATTA ATTGCTATTA ACGGATTATA CCGTCACGGT 
TTTTTAGTAG CGCCAGCGTT AATTGATGAA GTTATTCACA ATCTTTCAAG AGGCATTAAA 
TGA

Protein sequence

MKMKVGIAGA GLLGRLLAWQ LSKVGFGVTL FDKDDKSGQK STAYAAAGML SPVAECEIAE 
QIIFNLGSYS LRKWPLWLSS LNQPVYFKQN GSIVISHSHD EVEKERWLKQ ISRKIKDFSL 
EKLSSSALQR LEPELNFDEG YYLPQEAHLD SRALMQTLEK ELNVEWHSKT FVESVVPYRI 
LTKGKSYQFD CIFDCRGTGA GEMFSDLRSV RGELIYLHAP DVRLNRPIRL LHPRYRLYIV 
PRAHHIYLIG ASEIESNDIS PISVRTCLEL LSAVYSVHPA FAEARIIETV TALRPALSDN 
LPRIHYQPGL IAINGLYRHG FLVAPALIDE VIHNLSRGIK