Gene Bind_2221 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Bind_2221
Symbol
ID	6199536
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Beijerinckia indica subsp. indica ATCC 9039
Kingdom	Bacteria
Replicon accession	NC_010581
Strand	+
Start bp	2547114
End bp	2548676
Gene Length	1563 bp
Protein Length	520 aa
Translation table	11
GC content	60%
IMG OID	641706210
Product	hypothetical protein
Protein accession	YP_001833328
Protein GI	182679182
COG category	[R] General function prediction only [S] Function unknown
COG ID	[COG0645] Predicted kinase [COG2187] Uncharacterized protein conserved in bacteria
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	18
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	29
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCCGCCCG TATCTCCAGG CGAACTGGCC CATGACACCC ACGATGACGG ACAGGCGGAG 
ACGATAGCGT TCCTGCAATC GGAGAAAGCG TTTGGCGAAA AGCCGCTCAG GCCCCCCATA 
GCGACGCATA TTTCGCTGAT TTTTCTGTAC GCACAGCGCG CCATCAAGCT CAAACGCGCA 
GTCCATTTTC CCTATGTCGA TTTTTCCACA CCGGCCCTGC GGTTGGCCGC CTGCGAGCGT 
GAATTGGCGC TCAATCGCCG CACAGCGCCC ACTCTCTATT CGGGTGTACG GCGCATTACA 
CGGGACAATG ACGGATCTTT ACAGATCGAC GGAAAGGGAC CTCTGGTCGA TGCCGTCGTG 
GATATGCGGC GGTTCGACGA TGACGCCCTG CTCGCCCATC ACGCCGAGCA GGGCGGCCTC 
CCCATCCCGC TCCTGACCAA GCTCGCTCAG ACCATTGCGA CCTTTCACCG CGCCGCCGAA 
ACTGTCGCGA ATGGAAGGGA CGATGAAACC GCCACAGCGC GGCTGGCCAG GATAATCGAC 
CTCAACGAAG CGGCTTTCGC GAGCAATAGC ATCATTCCCG CACAAGCGTC CTTGGCACTC 
GCTCAAACTT TTCGCGCCAG GCTGGCAGCG CTTGCAAGTC TGCTCGATCA TCGCGCCAAG 
GCGGGCAAGA TCCGCCATTG TCACGGCGAT CTGCACCTGC GCAATATTTG TCTCCTCGAG 
GGAGAACCCA CGTTGTTTGA TTGCCTCGAG TTCGATGATG ATATGGCGCG TGTCGATATT 
CTCTATGATC TCGCCTTTCT TCTGATGGAT CTCTGGCATC GCGGCCTAGC GCGGGAAGCC 
AATTGGATTT TCAACCGCTA TCTAGATCAG ATGGACGAAG ACGACGGCTT GACCGCCATG 
CCCTTTTTCA TGGCGCTGCG CGCGGCCATT CGCGCCCATG TCGCGGCGAC GCTCGGCCGA 
TCCAACGAAG CCCTCTCTTA TTTCGCCCTC GCCCAGGCGC TTCTGCATCC ACGACCCGCT 
GCACTGGTCA GCATTGGTGG TCTTTCTGGA ACCGGCAAAT CGACACTTGC CGCCGCCTTG 
GCACCCGCGA TCGGGCCGGC GCCTGGCGCC CGCGTTCTTT CGAGCGACCG TATCCGCAAA 
GGATTATTCG GTGTTCGCGC TGAGACGCGC CTGCCCCCCG AGGCCTATGC GCCGGAAGTC 
TCAGCCCGCG TCTACGCGCG AATCACGACC CTGGCCGAGA CGATTTTGCA TCTCGGCCAG 
GGTGTCGTCG CCGATGCCGT TTTTGACCGG ATGGATGACC GCGCCGAAAT CGAACGCGTT 
GCCGCGAAGG GGAATGTCCC CTTTCTCGGC TTCTGGCTTG AAACGAGCCT CGAACGCCAG 
ATCGAACGTG TCGAGGCACG GCGCAATGAT GCATCCGACG CTGACGCGAC AATCGTGCTT 
GCCCAAAGAG ATCGCGACAC AGGCGCCATC CAATGGCATC ATCTTGTTTC CGACCATGAG 
GCCACGACAA CAGCCCGGCA AGCCTTGGAG ATCTGCCAAG CCCGTCTCGA ATGCCCGGCT 
TGA

Protein sequence

MPPVSPGELA HDTHDDGQAE TIAFLQSEKA FGEKPLRPPI ATHISLIFLY AQRAIKLKRA 
VHFPYVDFST PALRLAACER ELALNRRTAP TLYSGVRRIT RDNDGSLQID GKGPLVDAVV 
DMRRFDDDAL LAHHAEQGGL PIPLLTKLAQ TIATFHRAAE TVANGRDDET ATARLARIID 
LNEAAFASNS IIPAQASLAL AQTFRARLAA LASLLDHRAK AGKIRHCHGD LHLRNICLLE 
GEPTLFDCLE FDDDMARVDI LYDLAFLLMD LWHRGLAREA NWIFNRYLDQ MDEDDGLTAM 
PFFMALRAAI RAHVAATLGR SNEALSYFAL AQALLHPRPA ALVSIGGLSG TGKSTLAAAL 
APAIGPAPGA RVLSSDRIRK GLFGVRAETR LPPEAYAPEV SARVYARITT LAETILHLGQ 
GVVADAVFDR MDDRAEIERV AAKGNVPFLG FWLETSLERQ IERVEARRND ASDADATIVL 
AQRDRDTGAI QWHHLVSDHE ATTTARQALE ICQARLECPA