Gene Francci3_1411 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Francci3_1411
Symbol
ID	3903392
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Frankia sp. CcI3
Kingdom	Bacteria
Replicon accession	NC_007777
Strand	+
Start bp	1699854
End bp	1701257
Gene Length	1404 bp
Protein Length	467 aa
Translation table	11
GC content	75%
IMG OID	637878748
Product	UDP-N-acetylmuramoyl-tripeptide--D-alanyl-D- alanine ligase
Protein accession	YP_480517
Protein GI	86740117
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG0770] UDP-N-acetylmuramyl pentapeptide synthase
TIGRFAM ID	[TIGR01143] UDP-N-acetylmuramoyl-tripeptide--D-alanyl-D-alanine ligase

Plasmid Coverage information

Num covering plasmid clones	11
Plasmid unclonability p-value	0.0779363
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	7
Fosmid unclonability p-value	0.0360217
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGATCCCGC TGACCCTGGC CGAGGTCGCG TCGGCGACCG GCGGCCGGCT CGACGCGGTG 
CCCGACCCGG GCGTCACGGT GCGTTCGGTC GTCGTCGACT CCCGCGAGGT CCGCGACGGC 
GCCTTGTTCG TCGCCCTGGC TGGCAGCCGG GTCGACGGGC ACGACTTCGC CGCCGCCGCC 
GTCGCCGCCG GCGCGTCCGC CGTGCTCGCC GCCCGGTCGG TGGGCGAGCC GGCCGTCATC 
GTTCCCGATC CGCCTTCGGC GCTCGCCGCG CTCGCCGCGT ACGTCCGTGA TCTGGCCGCC 
GCCACCGTGG TCGCCGTGAC CGGGTCGGCG GGCAAGACGA CGACCAAGGA CCTGCTCGCC 
GACGTGCTGG GCGGGCTCGC CCCGACGGTG GCCGCGCCCG GCTCCTTCAA CAACGAGATC 
GGACTGCCGC TGACGCTGCT GCGCACCGAG CCGGACACGG CGTTCGTCGT CCTGGAGATG 
GGTGCCCGCG GTCCGGGGCA CATCGCCACC CTCTGCGCGG TAGCCCGCCC GGCTGTGGGG 
GTGGTCCTCA ACGTCGGCAG TGCCCACCTG GGCGAGTACG CCGACGGCCG GCTGGGGATC 
GCCGCGGCTA AGGGCGAGCT TGCCGAGGCC GCGAGCGAGG CCGTCGTGCT CAACGCCGAT 
GACCCGCTGG TCGCGGCGAT GGCGGTTCGG ACGACGGCCG AAGTGATCAC TTTCGGGGAG 
GGTGGACGGG CCGACGTGCG GGCCGGTGCC GTCGATGTCG ACCGGCTGGG CCGCGCCTCG 
TTCGACCTGC TGGCGCACGG CGAGCACCAT CGGGTGACCC TCGGGCTCGT CGGCGCGCAC 
CAGGTGCCGA ACGCGTTGGC CGCGGCGGCC GTCGCGATCC GGCTGGGGCT GTCCCCGGAC 
CGGGTCGCCG CGGCGCTGTC CGCCGCCCGC CCGCGCAGCC GGTGGCGGAT GGAGGTGACC 
TCCACCGCGG CCGGGGTGGT GGTCGTCAAC GACGCCTACA ACGCGAACCC GGAGTCGATG 
CGGGCGGCGC TGAAGGCGTT GGTGGACATG CGGGGGAAGG GCCGGGCGTT CGCGGTGCTC 
GGTCCGATGG GGGAACTCGG TGACGCCGCC GCCGCCGAGC ACGACGTGCT CGGCCGGTTC 
GCGGTCCGCC TCGGGGTCGA TCGACTGATC GCGGTGGGTC CGGCGGCCCG CCATATCCAC 
CTGGGCGCCT CGCTGGAAGG CTCCTGGGAC GGGGAGTCGG TGGAGGTGAC CGACGCCGAG 
GAGGCGGTGG CCCTGGTGGC CGCGCAGGCC GGACCGGACG ACGTGGTACT GGTCAAGGCC 
AGCCGGTCCT TCGGTCTGGA GCGCGTCGCC GAGGCGTTGG TGACCAGATT CGGCGTCCTC 
GGCGCCGGGA TCGAGGGGAC ATGA

Protein sequence

MIPLTLAEVA SATGGRLDAV PDPGVTVRSV VVDSREVRDG ALFVALAGSR VDGHDFAAAA 
VAAGASAVLA ARSVGEPAVI VPDPPSALAA LAAYVRDLAA ATVVAVTGSA GKTTTKDLLA 
DVLGGLAPTV AAPGSFNNEI GLPLTLLRTE PDTAFVVLEM GARGPGHIAT LCAVARPAVG 
VVLNVGSAHL GEYADGRLGI AAAKGELAEA ASEAVVLNAD DPLVAAMAVR TTAEVITFGE 
GGRADVRAGA VDVDRLGRAS FDLLAHGEHH RVTLGLVGAH QVPNALAAAA VAIRLGLSPD 
RVAAALSAAR PRSRWRMEVT STAAGVVVVN DAYNANPESM RAALKALVDM RGKGRAFAVL 
GPMGELGDAA AAEHDVLGRF AVRLGVDRLI AVGPAARHIH LGASLEGSWD GESVEVTDAE 
EAVALVAAQA GPDDVVLVKA SRSFGLERVA EALVTRFGVL GAGIEGT