Gene Bind_2020 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Bind_2020
Symbol
ID	6201344
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Beijerinckia indica subsp. indica ATCC 9039
Kingdom	Bacteria
Replicon accession	NC_010581
Strand	-
Start bp	2307626
End bp	2309266
Gene Length	1641 bp
Protein Length	546 aa
Translation table	11
GC content	51%
IMG OID	641706007
Product	levanase
Protein accession	YP_001833131
Protein GI	182678985
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG1621] Beta-fructosidases (levanase/invertase)
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	9
Plasmid unclonability p-value	0.0275003
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	23
Fosmid unclonability p-value	0.946482
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCTGTATA AATATCCTCA TCTAACGACT GGATTAGGGG GCTTACTGGC CCGCTTATTC 
GCCACATTCG TGATTTCATC TGCGATAGAG CTTGGTTCGT TCGGTCTGTT GCATGCCGAG 
GAGACAGGCA CGGTCCAGTG GCGTCCGGCC TTGCATTACA CGCCCGAACG GAACTGGATG 
AACGATCCAA ACGGATTGGT ATTCAATAAC GGCCTTTATC ATTTGTTCTA CCAATATAAC 
CCCAAAGGAA ATGTCTGGGG TAATATGTCA TGGGGACATG CAACCAGCCC TGATCTGATT 
CATTGGAATG AACATGATGT GGCGATGTCG GCAAACGAGA CCGAAGAGAT TTTCTCCGGC 
TCAATCGTCG TCGACGAACA CAATACATCC AGATTAGGCT CGGCGAATTC ATCCCCTCTC 
ATCGCACTTT ATACGAGTGC GTATAAGGCT GGGTCGGGTC ACCCCGCAGG AACTCAGGCA 
CAATCGCTTG CCTACAGCCA AGACGAAGCG CAAACGTGGC ATCCGTATGA TCATAATCCC 
GTATTGACTC TTAGCCCGGA GTCAAAAAAC TTTCGAGATC CAAAAATTTC CTGGTATCCG 
AAAGGAGGTT ATTGGCTGCT GACAACTGTT GTCGCGGATG CGCAAGTCGT TAAAATCTAT 
CGCTCCAATA ATCTGCTCAA CTGGGAATTC CTCAGTGATT TCAGTCTCCC TGGTATCCCT 
CATCAGGGTG CGCTTTGGGA AATGTCCGAT CTTTTCCCTC TTCCTCTTGA CGGCGATAAA 
AACGATCAAA AGTGGGTTAT GATTGTCAAT GTCAACCCTT GGTCAATCGC GGGAGGATCC 
GGCGCGCTTT ATTTCGTCGG AGGTTTCGAT GGCAAGGTGT TTGTTCCTGA GCATCTTCCT 
CCGGCAGGCT CGGACCCTTC CCAATATTTG TGGCTCGACC ACGGCGCCGA CTTTTATGCG 
GCTGGAACAT TTGCCCATGA GCCCCATGGC AAAGCGGTGA TCATGGGCTG GATGAGCAAT 
TGGGATTATG CGGAGCATGT CCCGACGGCA CCATGGAAAG GGGCAATGGC CCTGCCGCGT 
GTGCTCGCGT TGAAAACAAT CGATGGTATC CCGCAACTCG TCTTTTCTCC CGTCGATCAA 
TATACATCCC TAGTCCAGGG ACAGCCGGCG GCGAGAATTG AGACTCTGAC CGTCTCCTCG 
TCAATCAAGG AACTTGACCC GTCCACGCAA GGAACCGTGC AGAATATCGC GGTTACCATC 
CATCCCGGCG CCGCTCAACG TGCTGGGCTC ATCATACGCG GTTCAGCAAA GGGTGATGTG 
GGGACGCGGA TTTTTTATGA CACATCCAAC CACACATTGA CACTCGATCG TTCCCAATCT 
GGCGAAACGA ACTTTTCAAG TGCATTCAGT AAACAACATA TTGTCAACTT GCCGCTAGAG 
AATGGGGAAC TGCGTCTCAC AATCATTGTG GATAGGAATT CGGTCGAGGT TTTCGCCAAC 
AATGGCCGCG CAGTCATCAC GGATCTCATT TTTCCGACTC TTGATGACAA TCGCATCTCT 
GTCTTCGCGG AGCATGGCGA TGCGACATTC AATGACCTCG CCATTACCAA TCTCTCCGAT 
CTGACTAATA TAAAGCAGTA A

Protein sequence

MLYKYPHLTT GLGGLLARLF ATFVISSAIE LGSFGLLHAE ETGTVQWRPA LHYTPERNWM 
NDPNGLVFNN GLYHLFYQYN PKGNVWGNMS WGHATSPDLI HWNEHDVAMS ANETEEIFSG 
SIVVDEHNTS RLGSANSSPL IALYTSAYKA GSGHPAGTQA QSLAYSQDEA QTWHPYDHNP 
VLTLSPESKN FRDPKISWYP KGGYWLLTTV VADAQVVKIY RSNNLLNWEF LSDFSLPGIP 
HQGALWEMSD LFPLPLDGDK NDQKWVMIVN VNPWSIAGGS GALYFVGGFD GKVFVPEHLP 
PAGSDPSQYL WLDHGADFYA AGTFAHEPHG KAVIMGWMSN WDYAEHVPTA PWKGAMALPR 
VLALKTIDGI PQLVFSPVDQ YTSLVQGQPA ARIETLTVSS SIKELDPSTQ GTVQNIAVTI 
HPGAAQRAGL IIRGSAKGDV GTRIFYDTSN HTLTLDRSQS GETNFSSAFS KQHIVNLPLE 
NGELRLTIIV DRNSVEVFAN NGRAVITDLI FPTLDDNRIS VFAEHGDATF NDLAITNLSD 
LTNIKQ