Gene Franean1_5097 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Franean1_5097
Symbol
ID	5673432
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Frankia sp. EAN1pec
Kingdom	Bacteria
Replicon accession	NC_009921
Strand	-
Start bp	6100453
End bp	6101952
Gene Length	1500 bp
Protein Length	499 aa
Translation table	11
GC content	78%
IMG OID	641243948
Product	UDP-N-acetylmuramate--alanine ligase
Protein accession	YP_001509362
Protein GI	158316854
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG0773] UDP-N-acetylmuramate-alanine ligase
TIGRFAM ID	[TIGR01082] UDP-N-acetylmuramate--alanine ligase

Plasmid Coverage information

Num covering plasmid clones	10
Plasmid unclonability p-value	0.393339
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	7
Fosmid unclonability p-value	0.052337
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGACGGCGC GAGATCTCCC GGAGGGCTGG CGGCGGGTCC ACCTCGTCGG CATCGGCGGG 
ATCGCCATGA GCGGTCTGGC ACGGTTGCTG GTCGCGCGGG GCGCGACGGT CTCCGGCAGC 
GACGCGGTCG AGTCCCGGCG GCTGGCGTCG CTGCGCGCGC TCGGCGTCCC GGTCACGGTG 
GGCAACGGCC CCGACAGGTT CGACGCCTCG CGCCTCGACG GGGTCGAGCT GGTCGTCGTC 
GCGCCAGCGG TGCCGGGCGA CGACCTGGAG CTCGCCGAGG CGCGCCGGCG CGAGCTGCGG 
GTGCTGACCC GCTCCGCCGC GCTCGCCGGG CTGATGGCCG GGCACCGAGG CGTGGCGGTC 
GCGGGCTCGC ACGGCAAGAC CACCGTGGCG ATGATGCTCA CCGCCGCCCT GCAGGCCTGC 
GGCGCGGACC CGACGTTCGC GGTCGGCGGG GATCCGGGCG AGGCCGGCTC GCACACCCAC 
GCGGGCAGCT CCGAGCTGAT GGTCGTCGAG GCGGACGAGG ACGCCGGCGC GTTCTGGCAG 
CTCCAGCCGT ACGGCGCGGT GCTGACAGGG GTGGCCGCCG AGCACCTCGA CCACTACCGG 
ACGATGCCCG CCCTCGCCGC CTCGTTCGCG ACGTTCCTGC GCCGGGTCGA CCCGGGCGGC 
TTCCTGGTCG CCTGCGTGGA CGACGCGGCC GGGTGGGCGC TCGCCACGGC GGCGGCCGAC 
CACGCCGACC GCTGGCGCCG GGCCGGCGCC AGCGCCAGCG CCAGCGCCCC GGACGGTGGC 
CGGCCGTGGC TGACGGGGTA CGGGTTCGGG CCGTCGGCGG ACGTCCGGCT CGTCGCCGAG 
GAGATCTCGA TCGCGGGCAC CAGCGCGGAG GTCGTCGTCC ATGGCGTCCG GCTGGGCCGG 
CTGTCGCTGC GGGTCCCCGG CCGGCACCAC CTCCTGGACG CCGCGGCGGC CCTGGCCGCC 
GGGATCGCCC TGGGCGCCCC GCCGGCCGGC CTGCTGGCCG GGCTGACCGA GTTCGCCGGG 
GTCCGCCGCC GCTTCGAGTC GCTCGGGTCG GCGGGCGGGG TGCGGGTGGT CGACGACTAC 
GCCAACCACC CGGACCGGGT GGCCGCCGCG GTCGAGGCGG CGCGGGCGGC TGCCGGCGGC 
GGCCGGGTCG TCGTCGCGTT CCAGCCGCAC CTGTACAGCC GCACGGCCCT GCTCGCCGAC 
CGGTTCGGTG CCGCGCTGGG CTCGGCCGAC GCGGTCGTGG TGATGGACGT CTACGGCGCC 
GGGGAGCAGC CCGAACCGGG CGCGGGCGGT GCCCGGGTCG CCGCGGCCAC CCGGTCCGGG 
GCGGCGCGGG TCGGGGCGGC GCGGGTCGTG TACGAGCCGT CGTGGTCGGC CGTCCCGGGC 
GTGCTGATGG ACCTGGCACG GCCGGGCGAC CTGGTCATGA CGCTCGGCGC CGGGGACGTG 
ACGCAGGTCG GCCCGGAGCT GCTGCGTCTG CTGGCCGAAC GGTCGGCCCT GCCGGGCTAG

Protein sequence

MTARDLPEGW RRVHLVGIGG IAMSGLARLL VARGATVSGS DAVESRRLAS LRALGVPVTV 
GNGPDRFDAS RLDGVELVVV APAVPGDDLE LAEARRRELR VLTRSAALAG LMAGHRGVAV 
AGSHGKTTVA MMLTAALQAC GADPTFAVGG DPGEAGSHTH AGSSELMVVE ADEDAGAFWQ 
LQPYGAVLTG VAAEHLDHYR TMPALAASFA TFLRRVDPGG FLVACVDDAA GWALATAAAD 
HADRWRRAGA SASASAPDGG RPWLTGYGFG PSADVRLVAE EISIAGTSAE VVVHGVRLGR 
LSLRVPGRHH LLDAAAALAA GIALGAPPAG LLAGLTEFAG VRRRFESLGS AGGVRVVDDY 
ANHPDRVAAA VEAARAAAGG GRVVVAFQPH LYSRTALLAD RFGAALGSAD AVVVMDVYGA 
GEQPEPGAGG ARVAAATRSG AARVGAARVV YEPSWSAVPG VLMDLARPGD LVMTLGAGDV 
TQVGPELLRL LAERSALPG