Gene Bind_3643 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Bind_3643
Symbol
ID	6199608
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Beijerinckia indica subsp. indica ATCC 9039
Kingdom	Bacteria
Replicon accession	NC_010581
Strand	-
Start bp	4134211
End bp	4135176
Gene Length	966 bp
Protein Length	321 aa
Translation table	11
GC content	60%
IMG OID	641707594
Product	N-formylglutamate amidohydrolase
Protein accession	YP_001834684
Protein GI	182680538
COG category	[E] Amino acid transport and metabolism
COG ID	[COG3741] N-formylglutamate amidohydrolase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	7
Plasmid unclonability p-value	0.00118942
Plasmid hitchhiking	Yes
Plasmid clonability	hitchhiker

Fosmid Coverage information

Num covering fosmid clones	26
Fosmid unclonability p-value	0.928128
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACGTCGG ACGATCCTGG CAAGGACACG ACAAAAATCC AGCACGGGGA GGAGGCGCGA 
GATCTCGATT TCAACCCGCC TTTTGAGGTC CTGGAGCCTG AGACGCTGAC GTGTCCACTG 
GTGTTTTCCT CACCGCATTC TGGATCTCTT TACCCACGCC GCTTCCTCGT ATCGGCTCGG 
CTCGATGCCT TGACCCTGCG TCGTTCCGAG GATGTGCATG TCGATGCTTT GTTCCGCGGC 
GTGGCGGGGC TTGGCGCGCC TTTGATCCGG GCCCATTTTC CGCGCGCCTT TCTGGACGTT 
AATCGCGAGC CCTATGAGCT CGATCCCAAA ATGTTCGACG GCAAGTTGCC CGTTTTCTCC 
AATACGAGAT CATTGCGGGT CGCCGCTGGG CTCGGCACGA TCGCCCGTGT GGTCGGTGAA 
GCGCAGGAAA TCTATTTGGG ACGCTTGCCC GTCGAAGAAG CCATGTGGCG GATCGACCGT 
CTCTATAAGC CTTATCATCG CGCTTTGCGG GCACTGCTCG AACGCGCCGA AAAAACCTTC 
GGCGTTGCGC TTCTGGTCGA TTGCCATTCC ATGCCTTCGA ACACGCAGGC GGGCCTCGGA 
CAAAGCGAGA GTCGCGGCCC CGCGAGCCGC CCCGGAAACC GGCCGGATTT TGTGCTCGGC 
GACCGCTATG GGACGAGCTG CGCTGTCGAT CTTGTGGAAA CCGTGGAACA GGCCCTGCGA 
CAGATGGGCT ATCAGGTCCA GCGCAATAAA CCCTATGCCG GTGGCTTTAT CACCGAGCAT 
TACGGCAATC CCGCCACGCA TTTTCATGCC TTGCAGATCG AAGTGAGCCG CGGGCTCTAC 
ATGGACGAGA GGACCTTCGA ACCAAGTCCA TGTTTTGCGA CTGTTGCGGA AGATCTGACC 
AGAATGGCGG CGGCCCTGGC GGCGGCAATC GCCGATCGTC GGCCCCAACA GGCCGCAGCG 
GAATAA

Protein sequence

MTSDDPGKDT TKIQHGEEAR DLDFNPPFEV LEPETLTCPL VFSSPHSGSL YPRRFLVSAR 
LDALTLRRSE DVHVDALFRG VAGLGAPLIR AHFPRAFLDV NREPYELDPK MFDGKLPVFS 
NTRSLRVAAG LGTIARVVGE AQEIYLGRLP VEEAMWRIDR LYKPYHRALR ALLERAEKTF 
GVALLVDCHS MPSNTQAGLG QSESRGPASR PGNRPDFVLG DRYGTSCAVD LVETVEQALR 
QMGYQVQRNK PYAGGFITEH YGNPATHFHA LQIEVSRGLY MDERTFEPSP CFATVAEDLT 
RMAAALAAAI ADRRPQQAAA E