Gene Bind_2166 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Bind_2166
Symbol
ID	6198706
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Beijerinckia indica subsp. indica ATCC 9039
Kingdom	Bacteria
Replicon accession	NC_010581
Strand	-
Start bp	2472223
End bp	2473236
Gene Length	1014 bp
Protein Length	337 aa
Translation table	11
GC content	62%
IMG OID	641706155
Product	glycine oxidase ThiO
Protein accession	YP_001833275
Protein GI	182679129
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0665] Glycine/D-amino acid oxidases (deaminating)
TIGRFAM ID	[TIGR02352] glycine oxidase ThiO

Plasmid Coverage information

Num covering plasmid clones	14
Plasmid unclonability p-value	0.232699
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	24
Fosmid unclonability p-value	0.765835
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCGGATTC GCATTATCGG CGCCGGAATC ATGGGATTGA CGACGGCTTT CGAATTTGCC 
TCCCACGGGG CGGATGTCGA AGTCGTCGAA CAGCGTGATG GCCCCGGCAA GGGCTGTTCT 
TTCCTCGCTG GCGGCATGAT CGCGCCCTGG TGCGAGGTCG AAAGCGCCGA ACCCATTGTC 
GGCACTATGG GGCTCGAGGC ACTGCGGTTC TGGACCGAAG ATGTACCGGT GGCGACGCGT 
CAAGGAAGCC TAGTCCTTGC CCCGCCACGC GACCGGCCGG AACTTGCCCG TTTCTCTCGC 
CTTACCAGCC ATTATGAACG GATGGACGGC GCGGCGCTCG CCGCGCTCGA GCCTGATCTC 
GAAGGGCGTT TTGGCGAGGC GCTTTTCTTT CCCGAAGAAG CCCATCTTGA TCCACGCCAA 
GCCACGGCGG CCTTGGGTGA GCGATTGGCG GCAGCGCCCA ATGTCATTTT GCGTTACGGC 
ACCGAAGCCG AAGACCTGTC CGAAGCGGGT GCTGACTGGA TCATCGATTG CCGTGGCCTT 
GCCGGGCGGG ATGCCTTGCC CGATTTGCGC GGGGTCAAGG GCGAAATGCT GGTTCTGCGG 
ACGGGGGATA TCAGACTCGC AAGGCCCATC CGGCTTCTGC ATCCGCGTTT TCCGGTCTAT 
ATCGTGCCGC GCGGCGACGG CCGTTTCATG ATCGGCGCCA CCTCGATCGA AAACGAGGAA 
GAGGGGCGGA TCACGGCCCG TTCCATGGTT GAACTTCTGA GCGCGGCCAT GACCGTGCAT 
CCGGCCTTTG GAGAGGCGGA AATCATCGAA ACCGGGGCCG GTTTGCGTCC GGCCTTTCCC 
AATAATCTGC CACGCCTGCG GGTTGAGGGT CATGTCGTTC GGGCCAATGG TCTTTATCGG 
CATGGTTTTC TTCTGGCGCC CCCCGTGGCG CGCAGGATCA GGCGCATGGT TCTTGAAGGC 
GCTTCTTTTC CGGAGGTCAT GGATGCAGAT CCGCGTGAAC GGCAAAGAGC TTGA

Protein sequence

MRIRIIGAGI MGLTTAFEFA SHGADVEVVE QRDGPGKGCS FLAGGMIAPW CEVESAEPIV 
GTMGLEALRF WTEDVPVATR QGSLVLAPPR DRPELARFSR LTSHYERMDG AALAALEPDL 
EGRFGEALFF PEEAHLDPRQ ATAALGERLA AAPNVILRYG TEAEDLSEAG ADWIIDCRGL 
AGRDALPDLR GVKGEMLVLR TGDIRLARPI RLLHPRFPVY IVPRGDGRFM IGATSIENEE 
EGRITARSMV ELLSAAMTVH PAFGEAEIIE TGAGLRPAFP NNLPRLRVEG HVVRANGLYR 
HGFLLAPPVA RRIRRMVLEG ASFPEVMDAD PRERQRA