Gene Franean1_5102 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Franean1_5102
Symbol
ID	5673437
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Frankia sp. EAN1pec
Kingdom	Bacteria
Replicon accession	NC_009921
Strand	-
Start bp	6107384
End bp	6108862
Gene Length	1479 bp
Protein Length	492 aa
Translation table	11
GC content	78%
IMG OID	641243953
Product	UDP-N-acetylmuramoylalanyl-D-glutamyl-2, 6-diaminopimelate--D-alanyl-D-alanyl ligase
Protein accession	YP_001509367
Protein GI	158316859
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG0770] UDP-N-acetylmuramyl pentapeptide synthase
TIGRFAM ID	[TIGR01143] UDP-N-acetylmuramoyl-tripeptide--D-alanyl-D-alanine ligase

Plasmid Coverage information

Num covering plasmid clones	5
Plasmid unclonability p-value	0.0109044
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	7
Fosmid unclonability p-value	0.0566058
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGATCGCGC TGACGCTCGC CGAGGTGGCC GCCGCCACCG GTGGCCGGCT CACCGCCGGC 
GCGGACCGGT TGGCCCCGGT CACGTCGGTG GTGATCGACT CCCGTCAGGT CGGCCCGGGC 
GCGCTGTTCG TCGCCCTGCC CGGTGAGCGG GTGGACGGGC ACGACTTCGC CGCCGGCGCG 
GTCGCGGCCG GCGCGGTGGC CGTCCTCGGC GCCCGGGAGA CGGGCGTGCC CACCGTCGTC 
GCCGACCCGG CGGCGGCGCT GGCCGCGCTC GCCGCGCACC TGCGCGACCT CGCCCCGGCG 
ACCGTGGTCG GGGTGACCGG CTCGGCCGGT AAGACGACCA CCAAGGACCT GCTGGCCGAC 
CTGCTCGGCC GGCTCGGCCC GACGGTCGCC GCGGTGGGCT CGTTCAACAA CGAGATCGGC 
CTGCCGCTGA CCCTGCTGCG CACCGAGCCC GACACCGCGT TCGTGGTGCT GGAGATGGGC 
GCCCGCGGCA TCGGGCACAT CGCGACGCTG TGCGCGGTGG CCCGCCCGCA CGTCGGGCTG 
GTACTCAACG TCGGGTCGGC GCACGTGGGG GAGTACGCCG ACGGGCGGAA CGGCATCGCC 
GCGGCGAAGG GCGAGCTCGC AGAGGCGGCC ACCGGCCTGG TCGTGCTGAA CGCCGACGAT 
CCGCTGGTGG CGGCGATGGC CGGCCGCGCC GGCGCCCAGG TGGTCACCTT CGGCCGCGCC 
GCGGCGGCGG ACGTCCGCGC CGAGCGCGTC GAGGTGGGCG GTGACGGCCG GGCCGCGTTC 
GACCTGCTGG CCGGCGGGGA GCGCCACCGG CTGCGCCTCG GCCTCGTCGG CGCGCACCAG 
GTGGCCAACG CGCTGGCCGC CGCGGCGGTG GCGACATCAC TCGGCCTCGC GCCGGCCGAG 
GCCGCGGCGG CGCTCGAGGA GGCCCGCCCG CGCAGCCGCT GGCGGATGGA GGTGACGACC 
ACCCCGGACG GCGTGGTCGT GCTCAACGAC TCCTACAACG CGAACCCCGA GTCGATGCGC 
GCGGCCCTGA CCGCGCTGAT GGACATGCGG GGAGCGGGGC GGGCGTGGGC GGTGCTGGGC 
CCGATGGGCG AGCTCGGCGC CGACGCGGAC GCCGCGCACG ACACCCTGGG GCGGCTCGCC 
GCCGGGCTGG GCGTGTCACG GCTGGTGGCG GTCGGCGCCG GGGCGCGCCG GGTGCATCAG 
GCGGCGGAGC ACGAGGGCGC CTGGGCCGGC GAGTCGACCT GGGTGCCCGG GGTGGACGAG 
GCGGTCGCGC TGCTGGCCGC GCAGGTCCGC CCGGGTGACG TGGTTCTGGT GAAGGCGAGC 
CGGTCGTTCG GGCTCGAGCG GGTGGCCACG GGGCTGACCG CGGATGGTGG GGCCGGCCCA 
GCGGGCCGGC GGGACGGCGC CGCCGGCGCC GCGATCGAGG GGATCGAGAA CACGTGGAAC 
ACGGTGGGAC ACTCCGGCGA ACCAGGCGTG CGCGGGTGA

Protein sequence

MIALTLAEVA AATGGRLTAG ADRLAPVTSV VIDSRQVGPG ALFVALPGER VDGHDFAAGA 
VAAGAVAVLG ARETGVPTVV ADPAAALAAL AAHLRDLAPA TVVGVTGSAG KTTTKDLLAD 
LLGRLGPTVA AVGSFNNEIG LPLTLLRTEP DTAFVVLEMG ARGIGHIATL CAVARPHVGL 
VLNVGSAHVG EYADGRNGIA AAKGELAEAA TGLVVLNADD PLVAAMAGRA GAQVVTFGRA 
AAADVRAERV EVGGDGRAAF DLLAGGERHR LRLGLVGAHQ VANALAAAAV ATSLGLAPAE 
AAAALEEARP RSRWRMEVTT TPDGVVVLND SYNANPESMR AALTALMDMR GAGRAWAVLG 
PMGELGADAD AAHDTLGRLA AGLGVSRLVA VGAGARRVHQ AAEHEGAWAG ESTWVPGVDE 
AVALLAAQVR PGDVVLVKAS RSFGLERVAT GLTADGGAGP AGRRDGAAGA AIEGIENTWN 
TVGHSGEPGV RG