Gene Bind_2234 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Bind_2234
Symbol
ID	6198155
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Beijerinckia indica subsp. indica ATCC 9039
Kingdom	Bacteria
Replicon accession	NC_010581
Strand	-
Start bp	2561065
End bp	2562396
Gene Length	1332 bp
Protein Length	443 aa
Translation table	11
GC content	59%
IMG OID	641706223
Product	hypothetical protein
Protein accession	YP_001833341
Protein GI	182679195
COG category	[R] General function prediction only
COG ID	[COG1253] Hemolysins and related proteins containing CBS domains
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	17
Plasmid unclonability p-value	0.840085
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	30
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGGCGATG GCAGTAGTCT GAGTGATATC CTCGGGATTC TTGCTGTTTT CCTGCTGGTC 
TTCGCCAATG GTTTTTTCGT CGCCGCCGAA TTCGCGCTGG TCTCGGTCCG GCGGAGCCGC 
GTGGCCGAAC TCGTGGCCGC CAAGCGCGTC AATGCGTTGA GCCTGCAAAC GACTCTCAAC 
CATCTGGATC TCAATCTCGC CGCGACTCAG CTCGGCGTCA CCATTTCCTC GCTCGGCCTT 
GGCTGGATCG GCGAACCGGC CCTGGCGCAT CTCATCGAGC CTCTGTTCAG CGCCTTGCCG 
CGTGACTGGA TGTCCGCCGG CTCGCACGCA ATCTCCGTCG CCATTTCCTT CATCATCATC 
ACCGCCTTGC ATATTGTGCT CGGTGAATTG GCTCCCAAAA GCCTTGCTCT GCAGCGAACG 
GAACGGACCG CGCTTTTCGT CGTCGGCCCC CTCAATGTGT TCCAATTCGT CCTGCGACCG 
GCGATTATAG CCTTGAATAC GCTTGGTAAT ATGGTTTTGC GCATCGTTGG TCTTCAGGCT 
GGAAAGGGCG AGGAATCACG CCATTCCCCG GAAGAGTTGA AATTGCTGGT CGCGGCGAGC 
CGCAAGGCCG GTTTGCTGCA GGAAGCGCAG CAGGAAGTTC TCGACCGCGT GTTCAATATC 
GGGCAGCGCC GGATCGGCGA TATTATGACG CCTCGCGTCG ATCTCGATTG GATTGATCTC 
GACGATAAGC CGGATGACAT TCTCAAATCG ATTCGGGAAT GCCGGCACGA GCAATTACTG 
GCTGGACGCG GCAATATCGA CGAGCCGCTT GGCATGGTTT CCAAGAAGGA ATTGCTCGAT 
CAGGTTCTCG ACGGGGGGCA GATTAATGCC GCCGCGGCTC TGCGCGAGCC GCTCGTCGTG 
CATGAATCGA CGCCGGTGTT TCGTGTGCTG GAGCAATTCA AGCGCGCGCC GGTCAGGCTG 
GCTTTGGTCG TGGATGAATA TGGCAGTCTC GAAGGGATTG TGACGCAGAC CGATCTTCTG 
GAAGCGATCG CCGGCGATCT CGCCGCCACG GAGGATGATA CTCCCGATAT TGTCGAGCGC 
GCGGATGGTT CCCTCCTGAT CGAGGGCATG ATGCCAGCGC ATGAGGCTTT TGAGCGTCTG 
GGCGTCAAGG ATCGGCCGGA GGAGGAAGAT TATCACACGC TCGCTGGTTT TGCCCTGCAC 
CAGCTCGAAC ATCTTCCAGA GGTCGGCGAG GAATTCTCGT GGGATGGCTG GCGTTTCGAG 
ATCGTCGACA TGGACGGGCG CCGGATCGAT AAATTGCTCG CGACGCGCGA GAGCGAATCG 
AAAAGCTTAT GA

Protein sequence

MGDGSSLSDI LGILAVFLLV FANGFFVAAE FALVSVRRSR VAELVAAKRV NALSLQTTLN 
HLDLNLAATQ LGVTISSLGL GWIGEPALAH LIEPLFSALP RDWMSAGSHA ISVAISFIII 
TALHIVLGEL APKSLALQRT ERTALFVVGP LNVFQFVLRP AIIALNTLGN MVLRIVGLQA 
GKGEESRHSP EELKLLVAAS RKAGLLQEAQ QEVLDRVFNI GQRRIGDIMT PRVDLDWIDL 
DDKPDDILKS IRECRHEQLL AGRGNIDEPL GMVSKKELLD QVLDGGQINA AAALREPLVV 
HESTPVFRVL EQFKRAPVRL ALVVDEYGSL EGIVTQTDLL EAIAGDLAAT EDDTPDIVER 
ADGSLLIEGM MPAHEAFERL GVKDRPEEED YHTLAGFALH QLEHLPEVGE EFSWDGWRFE 
IVDMDGRRID KLLATRESES KSL