Gene Bind_1058 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Bind_1058
Symbol
ID	6201022
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Beijerinckia indica subsp. indica ATCC 9039
Kingdom	Bacteria
Replicon accession	NC_010581
Strand	+
Start bp	1214252
End bp	1215286
Gene Length	1035 bp
Protein Length	344 aa
Translation table	11
GC content	59%
IMG OID	641705051
Product	CBS domain-containing protein
Protein accession	YP_001832190
Protein GI	182678044
COG category	[R] General function prediction only
COG ID	[COG1253] Hemolysins and related proteins containing CBS domains
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	14
Plasmid unclonability p-value	0.279471
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	24
Fosmid unclonability p-value	0.884616
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAGTGAAC GCGACACCTA TGCGGCAGGT GAAAATGCCG TGCCTGATCG GGGCGGGCAG 
GGCCAACGGC CCAATCTGAT TGATCGCTTG CGCCTTTTGT TCGGTCTCGG TGGCCCGACG 
ATCCGCGATG AATTGCAGGA GGCCTTGAGC GATACGGCCA CCGACGCAGA AATTTCACCG 
CAACAGCGGA CCATGCTGAA GAATGTCCTC GGTCTGCATG AGGTGCGGGT CGAAGATGTC 
ATGGTGCCGC GCACTGATAT TATCGCCGTC TCGCTCGACT CGACCCTTGC CGAGGTCCTG 
GATCTGTTCC GTTCCGCTGG CCATTCTCGT CTGCCCGTGC ATGGCGACAC GCTCGACGAT 
CCACGCGGTA TGGTCCACAT CCGCGATTTC GTCGATTATC TTGCCGGTCT CGCCTTGCCT 
GAAACCGAGA CGGTCCCGTC TCATGCCGAC AAAACGCCGC CGGCGGTGGT GAAGACGCTG 
GCCGGCCCGT ATAAGCTCGA TATTGGCGCG ACGACATTGG CCGAAGCCAA GATCCTGCGG 
CCCGTTTTGT TCGTGCCCCC CTCCATGCCG GTCCTTGATC TGCTCGTGAA AATGCAGGCG 
ACCCGCACGC ATATGGCGTT GGTCATCGAC GAATATGGCG GGACAGACGG TTTGGCCTCG 
ATCGAGGATA TTGTCGAAAT GATTGTCGGT GATATCGAAG ACGAGCATGA TTTGGAGGAA 
AGTCCTAAAA TCGAAGCGAC GGAAGACGGC GCTTTCATCG TCGATGCGCG CGCCGATCTC 
GAGGAAGTCG GTGCCGTGAC GGGGATCGAC TTTGAGGCGA TGGATGTCAC AGAGTCTTTC 
GATACGCTCG GGGGGCTGAT CACCGCCATG ATGGGGCATG TGCCCGTCCG GGGCGAAATG 
ATCGAAGAAG GGACGCTCAG TTTCGAAATT CTCGACGCCG ACCGGCAAAA GATCGAACGC 
ATCAAGATTT ATGGCGCGCC GGGCGGGCGC GTTGGCGAGG AAACAGGCTA CGTCGCAGAG 
AAAGGCAAAG CGTGA

Protein sequence

MSERDTYAAG ENAVPDRGGQ GQRPNLIDRL RLLFGLGGPT IRDELQEALS DTATDAEISP 
QQRTMLKNVL GLHEVRVEDV MVPRTDIIAV SLDSTLAEVL DLFRSAGHSR LPVHGDTLDD 
PRGMVHIRDF VDYLAGLALP ETETVPSHAD KTPPAVVKTL AGPYKLDIGA TTLAEAKILR 
PVLFVPPSMP VLDLLVKMQA TRTHMALVID EYGGTDGLAS IEDIVEMIVG DIEDEHDLEE 
SPKIEATEDG AFIVDARADL EEVGAVTGID FEAMDVTESF DTLGGLITAM MGHVPVRGEM 
IEEGTLSFEI LDADRQKIER IKIYGAPGGR VGEETGYVAE KGKA