Gene Franean1_1014 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Franean1_1014
Symbol
ID	5669428
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Frankia sp. EAN1pec
Kingdom	Bacteria
Replicon accession	NC_009921
Strand	+
Start bp	1196645
End bp	1197754
Gene Length	1110 bp
Protein Length	369 aa
Translation table	11
GC content	70%
IMG OID	641239943
Product	glycosyl transferase family protein
Protein accession	YP_001505376
Protein GI	158312868
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG0472] UDP-N-acetylmuramyl pentapeptide phosphotransferase/UDP-N-acetylglucosamine-1-phosphate transferase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	11
Plasmid unclonability p-value	0.258485
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	14
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCGCGAGT ATCTGCTCGT CTTCGCGGTG GCGGCGGCGG TCACCTTCCT CACGACGCCG 
ATCGCCCGCT GGATCGCCTT CCGTGTCGGG GCGGTCGCCC GGCCCCGGGC CCGGGACGTG 
CACGCGACGC CCACCCCGCG GCTCGGTGGC CTGGCGATGT TGGCCGGGCT CTATGCGGGC 
CTCGAGGTGG CCGATCAACT GCCGTTCCTC TCCGTGGTCT CCCAGGACTG GTCGGAGACT 
CGTGCCGTCC TGGTCGCCGG CACGCTGATC TGCCTGCTGG GGGCGGCCGA CGACCGCTGG 
GAGCTGGACT CGCTGACCAA GCTCGCCGGT CAGGTCGCGG CCGCCGGCGT CATGGTCCTG 
CTCGGCGTGC AGTGGTCCTT CGCGATCGAC CGGAACAGCG AGACCACACT CAGCTTCGGG 
CCGGAGACCG CCGTCCCGCT GTCCATCTTC GCCACGCTCA TCCTGGTCAA CGCGATGAAC 
TTCATCGACG GCCTGGACGG GCTGGCCGCC GGGGTCGCCG CGATCGCGGC CGGTGCCACG 
TTCTATTTCG CCTACCAGAT CGCGGTGATC AACGGCTTCT ACCGGGCCTC ACCGGCCGCG 
CTGCTCGCCG CGGTCACCGC CGGGGTGTGT GTCGGCTTCC TTCCGCATAA TTTCAACCCG 
GCCCGCCTGT TCATGGGGGA TTCCGGCTCG ATGCTCATCG GGCTGCTCTC GGCCGCCTCG 
ATGATCTCGG TGACCGGTCA GGTCGCGTAC GGGGGTTACG CTGGACCCTC CCAACAGCTT 
CCGTCGCTGA TTCCGCTGGC CATCCCGCTG GCGGTGCTGG CCGTCCCGGT GCTCGACTTC 
GGGCTCGCGG TCATCCGGCG GACGAAGGCG GGGCGCTCGC CGTTCGCGGC AGACAAGATG 
CACCTGCATC ATCGAATTCT TTCGATTGGC AACTCCCACG TCAGGGCGGT TCTGCTGATG 
TACTTCTGGG CCGCGCTCGT CGGCTTCGGG GGAGTGGCGG CCTCCTTCTC CGACTCGCCG 
CTGCCGATCC TCGCCGCCAC CGTCGGCGTG GGGCTGCTCG CGCTGCTCGC CCTTCTTCTG 
ACGGGCCAGC GCGCGGCCCG GCGCGCATGA

Protein sequence

MREYLLVFAV AAAVTFLTTP IARWIAFRVG AVARPRARDV HATPTPRLGG LAMLAGLYAG 
LEVADQLPFL SVVSQDWSET RAVLVAGTLI CLLGAADDRW ELDSLTKLAG QVAAAGVMVL 
LGVQWSFAID RNSETTLSFG PETAVPLSIF ATLILVNAMN FIDGLDGLAA GVAAIAAGAT 
FYFAYQIAVI NGFYRASPAA LLAAVTAGVC VGFLPHNFNP ARLFMGDSGS MLIGLLSAAS 
MISVTGQVAY GGYAGPSQQL PSLIPLAIPL AVLAVPVLDF GLAVIRRTKA GRSPFAADKM 
HLHHRILSIG NSHVRAVLLM YFWAALVGFG GVAASFSDSP LPILAATVGV GLLALLALLL 
TGQRAARRA