Gene Franean1_5169 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Franean1_5169
Symbol	ligC
ID	5673503
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Frankia sp. EAN1pec
Kingdom	Bacteria
Replicon accession	NC_009921
Strand	-
Start bp	6201061
End bp	6202287
Gene Length	1227 bp
Protein Length	408 aa
Translation table	11
GC content	73%
IMG OID	641244023
Product	ATP-dependent DNA ligase
Protein accession	YP_001509433
Protein GI	158316925
COG category	[L] Replication, recombination and repair
COG ID	[COG1793] ATP-dependent DNA ligase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	5
Plasmid unclonability p-value	0.00454515
Plasmid hitchhiking	No
Plasmid clonability	decreased coverage

Fosmid Coverage information

Num covering fosmid clones	16
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCGCGAGG ATCGGCGGGT GGACCTGCCT GTGACACCGC CGGTGAAGCC GATGCTCGCC 
CGCGCGGCGC CGCAGATCCC CCCGGACATG CTGTATGAGC CGAAGTGGGA CGGCTTCCGC 
GCCCTGGTCT TCCGTGACGG GGCCGAGCTG GAGATCACCT CGCGCAACAC CCGGCCGATG 
ACCCGCTACT TCCCCGAGCT GGTCGAGGTG CTGCTCGCGG CACTGCCCGA CCGCTGCGTG 
CTTGACGGCG AGATCGTCGT CGTCGGCCCG AACGGACTGG ACTTCGAGGA GCTGTCGCAA 
CGGGTGCATC CGGCGACCAG CCGGGTGGCG AAGCTCGCGC TGGAGACCCC GGTCTCGTTC 
GTCGCGTTCG ACCTGCTGGC ACTCGGTGAC GAGGCGTTCA CGGACCAGCC GTTCGCCCGG 
CGGCGCGCCG TGCTCGAGGA GGTTCTCGCC GGCCACGCCG GCCCGGCTGC GCCCGGAACG 
GCACCGGCCC GGCGGATCCC GAGCGGGGTC TACCTCACGC CCTCGACCGG CGAGCTCGAC 
ATGGCCCGGC AGTGGTTCGA GCTCTACGAA GGCGCGGGGC TCGACGGGCT GGTCGCCAAG 
CCGCCGGACG GGGCGTACCA GCCGGACAAG CGCGCAATGT TCAAGATCAA ACATGACCGC 
ACCGCCGACT GCGTCGTGGC CGGCTACCGG CCGCACAAGA ACGATCCGGA GGCGGTCGGG 
TCGCTGCTGC TCGGGCTCTA CGCCGACCCC GCGGACGAGG CCGACCCCGA GAACGCGACG 
GACCCGGCTC GGGAAAGCCC GCTGCTGTCC GTCGGGGTCA CCTCGGCCTT CCCGATGGCG 
CGCCGGCGGG AGCTCGTCCG CGAGCTGGCC CATCTCGTGG TGCCGATCGA CTCCCACCCC 
TGGGCCCGCC AGGGCCCGGA GAACGCCGCG CAGCCGGGCG GCGACGCGGG CGAGGAACCG 
GCAGCGGCCG CGGGGCAGCC GGCGCGCACG CCCTGGGACG TCGGGGAGAG CCGGTGGGCC 
CGTGGCCGTG ACCTCTCGTT CGTCCCGCTG CGGCCCGAGC TGGTCGTCGA GGTGCGCTAC 
GACCACATGG AGGGACCGCG CTTCCGGCAC ACCACGCAGT TCGTCCGCTT CCGGCCCGAC 
CGTGACCCCG GCGGATGCAC CTACGCCCAG CTCGAGCGTC CGGTGCGGTT CGACATCGCC 
GACGTCCTGC GCATCCCGCC GGACTGA

Protein sequence

MREDRRVDLP VTPPVKPMLA RAAPQIPPDM LYEPKWDGFR ALVFRDGAEL EITSRNTRPM 
TRYFPELVEV LLAALPDRCV LDGEIVVVGP NGLDFEELSQ RVHPATSRVA KLALETPVSF 
VAFDLLALGD EAFTDQPFAR RRAVLEEVLA GHAGPAAPGT APARRIPSGV YLTPSTGELD 
MARQWFELYE GAGLDGLVAK PPDGAYQPDK RAMFKIKHDR TADCVVAGYR PHKNDPEAVG 
SLLLGLYADP ADEADPENAT DPARESPLLS VGVTSAFPMA RRRELVRELA HLVVPIDSHP 
WARQGPENAA QPGGDAGEEP AAAAGQPART PWDVGESRWA RGRDLSFVPL RPELVVEVRY 
DHMEGPRFRH TTQFVRFRPD RDPGGCTYAQ LERPVRFDIA DVLRIPPD