Gene Bind_0007 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Bind_0007
Symbol
ID	6201674
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Beijerinckia indica subsp. indica ATCC 9039
Kingdom	Bacteria
Replicon accession	NC_010581
Strand	+
Start bp	5533
End bp	6546
Gene Length	1014 bp
Protein Length	337 aa
Translation table	11
GC content	64%
IMG OID	641704003
Product	porphobilinogen deaminase
Protein accession	YP_001831155
Protein GI	182677009
COG category	[H] Coenzyme transport and metabolism
COG ID	[COG0181] Porphobilinogen deaminase
TIGRFAM ID	[TIGR00212] porphobilinogen deaminase

Plasmid Coverage information

Num covering plasmid clones	5
Plasmid unclonability p-value	0.000143071
Plasmid hitchhiking	Yes
Plasmid clonability	hitchhiker

Fosmid Coverage information

Num covering fosmid clones	23
Fosmid unclonability p-value	0.582224
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTCGAGGA ATAGCACGAT CGCTAACCCG CCGATAGATC AACCCCTTCC CCGTCTGCGG 
CTCGGCACGC GCGGCAGCCC GCTGGCGCTT GCCCAGGCGC ATGAGCTGGC AGATCGTCTT 
GCCCGCGCGC ATGGCTTTGC GAAAGAAGCA GTTGCCATCA CGATCATCCG CACGAGCGGC 
GACATGATTC AGGACCGGCC CCTTTCCTTG GCGGGAGGCA AGGGCCTGTT CACCAAGGAA 
CTCGATCAGG CCTTGATCGA AGGCATGGTC GATCTCGCCG TCCATTCCGC CAAGGACCTG 
CCGACCATCC TGCCGGAAGA CCTCATCATC GCCGGCTATT TGCCGCGCGA GGACGTGCGC 
GATGTCTGGA TCTCCCCAAA GGCCGGCCAT CCGCGCGATT TGCCGCCGGG CTCTGTCGTC 
GGTACGGCCT CGCTGCGGCG CGGTGCACTT TTGAAACGGC TGCGCCCCGA TCTCGAAGTC 
AGATTATTGC GCGGCAATGT CGAGACGCGG CTCGCCAAAC TGGCCGCCGG GGAGGTCGAT 
GCGACTTTAC TGGCACTGGC TGGCCTCCGT CGCCTCGGCC TTGCCGACAA GGCGACACAA 
GTGCTGGCGA TCGAGGATTT TCTGCCCGCC GCCGGGCAGG GCGCGATCGG CATTACGACA 
CGGCGGGATG ATGCGGCCAC CCTGGCGCTT CTCGCGCCGA TTCTCGATCC GGCGACTCAT 
GTGGCGCTCG CCGCCGAGCG CGGCTTCCTC ACCGTGCTCG ATGGGTCCTG CAAAACGCCG 
ATCGGTGCTC ATGCCACGGT CGAACACGAT CAAGTCACTT TGCGCGGCAT CGTCTTGCGG 
CCGGATGGAT CGGAATGGTT CGAGGCCTGT GAAAGCGGTC CCCTTGAAAG CGGTTCCCTG 
GAGGCGGCGC GGGAATTAGG CGAAACCGCA GCGCGCGCTA TTCTGGCGCG GTTGCCGGAA 
GGATTCTTCC AAGAGAGCGC CCAAGAAAAT GCCCAAAAAA ACGCTAAGGA GTAG

Protein sequence

MSRNSTIANP PIDQPLPRLR LGTRGSPLAL AQAHELADRL ARAHGFAKEA VAITIIRTSG 
DMIQDRPLSL AGGKGLFTKE LDQALIEGMV DLAVHSAKDL PTILPEDLII AGYLPREDVR 
DVWISPKAGH PRDLPPGSVV GTASLRRGAL LKRLRPDLEV RLLRGNVETR LAKLAAGEVD 
ATLLALAGLR RLGLADKATQ VLAIEDFLPA AGQGAIGITT RRDDAATLAL LAPILDPATH 
VALAAERGFL TVLDGSCKTP IGAHATVEHD QVTLRGIVLR PDGSEWFEAC ESGPLESGSL 
EAARELGETA ARAILARLPE GFFQESAQEN AQKNAKE