Gene Franean1_6989 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Franean1_6989
Symbol
ID	5675300
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Frankia sp. EAN1pec
Kingdom	Bacteria
Replicon accession	NC_009921
Strand	+
Start bp	8511212
End bp	8512402
Gene Length	1191 bp
Protein Length	396 aa
Translation table	11
GC content	72%
IMG OID	641245835
Product	glucan endo-1,3-beta-D-glucosidase
Protein accession	YP_001511226
Protein GI	158318718
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	13
Plasmid unclonability p-value	0.632525
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	18
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCCGAACC GCCGCACGTT CCTGCTGGCG GCGTCCGCCG CCGTCGCGGG TACCGCCGGA 
GGCGCCGTGT GGGCCGCCGC CGGCAGCCGG GAGCACGCCG CGCTCGCTGC TGGCGCGGGC 
CTGCCGCTGA CCGTGGTCAA CCACACCTAC CGGTACGCCA ACAACCAGAT CTGGCTCTAC 
GTCGTCGGCA CCGACCTGAT CACCGGCCGG CAGGTGTACG CCCGCCGCGA CGGCGCCCTC 
GCCCAGGTCT CACTCGCCGA CAACGGCCCG GACGGCTTCG CCGACCTGTC CATCCCCCTG 
GTGTCGGACG GTGACACGCC GTTCGTCGTC CCGAACGGGA TGTCCGGGCG GATCTACGTG 
TCGACCGGTT CGAAGCTGCG CTTCAAGGTC GTGGTCGATG GCGCGGGCAA CGCGGCGCTC 
CAGCACCCGG CCGGCTGGGT GCGCGCCGAC CCCAGCTTCG GCGTGGTGCA CGACTTCGTC 
GAGTTCACCC ACAACGACGC CGGCATGTTC TGCAACACCA CGGCGGTCGA CATGTTCAGC 
GTGCCGATGG CCATCGGGCT GCGCGGCAGC GCCGACCAGA CGACTGGACG GCTGGCGTCG 
GGCGGCCGGG CCGCCGTCTT CGACGCGATG CGGGCACACC CGGTGTTCGC CCCGCTGGTC 
GTCGACGACG CTGACCGGCA GGGCACTCGG GTGATCGCTC CGGGCCACGG CCTGGAGGCC 
GGCATCTTTC CCGCCACCTA TTTCGACGGC TACATCGACG CGGTGTGGAA CCAGTACACG 
TCGCGCCAGC TCACGGTGAA CGTCGGGACG AGCACCCGGG TCGGCACGGT GAACGGCGGC 
CTGCTGCGCT TCGACGGCGG GGTCGCGCCG TTCGTCCGGC CGAGCACCCG CGACGTCCTG 
TTCTGCGACG GCGCGCTCGC GGCGCCGAAC GACGGCGTCA CCGGGCCGGT GGCCGCCGTG 
CTGGGAGCCG GCTTCAACCG TTCGACGCTG CTCACCCAGC CGACCCAGCC GACGACCGAC 
CCCGCGGGCT TCTACCGCGA CCCGACGACC AACCACTACG CCCGGGTCCT GCACGAGCAC 
AGCGCGGACG GCCGAGCGTA CGGATTCGCC TTCGACGACG TCGCCGGCTT CGCCTCCTAC 
ATCCAGGACA CCGCGCCGAC GTCCGCCACC CTGTGGCTCA CGCCCTTCTG A

Protein sequence

MPNRRTFLLA ASAAVAGTAG GAVWAAAGSR EHAALAAGAG LPLTVVNHTY RYANNQIWLY 
VVGTDLITGR QVYARRDGAL AQVSLADNGP DGFADLSIPL VSDGDTPFVV PNGMSGRIYV 
STGSKLRFKV VVDGAGNAAL QHPAGWVRAD PSFGVVHDFV EFTHNDAGMF CNTTAVDMFS 
VPMAIGLRGS ADQTTGRLAS GGRAAVFDAM RAHPVFAPLV VDDADRQGTR VIAPGHGLEA 
GIFPATYFDG YIDAVWNQYT SRQLTVNVGT STRVGTVNGG LLRFDGGVAP FVRPSTRDVL 
FCDGALAAPN DGVTGPVAAV LGAGFNRSTL LTQPTQPTTD PAGFYRDPTT NHYARVLHEH 
SADGRAYGFA FDDVAGFASY IQDTAPTSAT LWLTPF