Gene Franean1_6068 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Franean1_6068
Symbol
ID	5675778
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Frankia sp. EAN1pec
Kingdom	Bacteria
Replicon accession	NC_009921
Strand	+
Start bp	7386717
End bp	7387916
Gene Length	1200 bp
Protein Length	399 aa
Translation table	11
GC content	72%
IMG OID	641244919
Product	glycoside hydrolase family protein
Protein accession	YP_001510318
Protein GI	158317810
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG3757] Lyzozyme M1 (1,4-beta-N-acetylmuramidase)
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	14
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	12
Fosmid unclonability p-value	0.646816
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACACCGG TGCCCGGGCC GGGGACGTCC GAGCCCGTCC TGTTCACGGA GCCGTCCCCC 
GCCTGGCCCA AGGGCATCGA CATCGCATCG TGGCAGCACC CCGGGTCGGC GCCGATCGAC 
TGGAACGCGG TCAAGGGCGC CGGCATGACC TTCGCAATCG TGAAGGCCAC CGAAGGAACC 
AATTACACGA ATCCGTTCTT CGTCGGCGAC CGGGACGCGG CCGGCAAGGC GGGCCTCGCC 
GTCGGCGCCT ACCACTACGC CCGCCCGGCG GCCCCGATCT CGACCGCCGT CGACCAGGCC 
CGGCACTTCC TGGCTGTGAC CGGCCTCACG CGCACAGCCG GCCACCTGGC TCCGGTCCTG 
GACCTGGAGA CCACCGGCGG GCTCGATCCG GCGGCCCTCG CGGCCTGGAC CCGGGCCTTC 
CTGGAGGAGA TCGAGTCCCA GACCGGCCGG GCGCCCATCC TGTACACGTA CCGGTCGTTC 
TGGACGGACA GCATGGCCGA CACGAAGGAG TTCGCCCGGT ACCCGTTCTG GTTCGCCATC 
TACAACAACG AGTCCACCCC GGGATGGCTG CCGGGCGGCT GGCCCGGCTG GGCGATGTGG 
CAGTACACGT CCTCTGGCGT GGTCCCCGGG ATCATCGGGA GCGTCGACAT GAACGTCGTG 
TGCTGCTCCG CCCCCGCGCT GACCGGGCTC GCCGACGGCA CCCTCTCCGA GATCGACAAG 
CGGTACGCGG CGGCCGGGCT GCTGCAGCTC GCCCTCGGGG CGCCCACCGG AGCGGAGGTC 
GTCGCGGGCG GCGGCGGCCG CTGGCGCCCC TTCACGAACG GGCTGATCTA CTGGTCCGTC 
GCGACGGGAC CGCGGGTGCT GCACGGCGAG ATCGCGAAGA AGTACCTGGG CCTCGGCGGG 
ACCAACAGCT TCCTCGGACG TCCGCTCGGC GACGTCGAGT GGGCCGCCGC GCCCGGCGCC 
CACCAGGCGA TCTTCCAGGG CGGCTGGATC TACTGGCACC CGACGACCGG GGCGCACGAG 
GTGCACGGCC TGATCCTGCG CCGCTACCTG GAACTGGGCG GCTCGACGTC CAGCCTGGGT 
CTTCCGATCA CGGACGAGTA CTCGGTGCCG GGCGGCCGGG AAAGTGCCTT CCAGTTCGGC 
AAGCTGCGCT GGACGGCCGC GACGAACGCG GTGACCCTGC TGCCCGCGGC GGCGCCCTGA

Protein sequence

MTPVPGPGTS EPVLFTEPSP AWPKGIDIAS WQHPGSAPID WNAVKGAGMT FAIVKATEGT 
NYTNPFFVGD RDAAGKAGLA VGAYHYARPA APISTAVDQA RHFLAVTGLT RTAGHLAPVL 
DLETTGGLDP AALAAWTRAF LEEIESQTGR APILYTYRSF WTDSMADTKE FARYPFWFAI 
YNNESTPGWL PGGWPGWAMW QYTSSGVVPG IIGSVDMNVV CCSAPALTGL ADGTLSEIDK 
RYAAAGLLQL ALGAPTGAEV VAGGGGRWRP FTNGLIYWSV ATGPRVLHGE IAKKYLGLGG 
TNSFLGRPLG DVEWAAAPGA HQAIFQGGWI YWHPTTGAHE VHGLILRRYL ELGGSTSSLG 
LPITDEYSVP GGRESAFQFG KLRWTAATNA VTLLPAAAP