Gene Franean1_4985 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Franean1_4985
Symbol
ID	5673324
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Frankia sp. EAN1pec
Kingdom	Bacteria
Replicon accession	NC_009921
Strand	-
Start bp	5980635
End bp	5981822
Gene Length	1188 bp
Protein Length	395 aa
Translation table	11
GC content	75%
IMG OID	641243839
Product	hypothetical protein
Protein accession	YP_001509255
Protein GI	158316747
COG category	[F] Nucleotide transport and metabolism
COG ID	[COG0151] Phosphoribosylamine-glycine ligase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	8
Plasmid unclonability p-value	0.076001
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	14
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

CTGAGCGCGG CGCGCCTCTG GTTCAACCAG ACCTGGCGCG GCACCTACCA GCTCATCGGG 
CTGCTGCGGG ACGGAGCCGG CCCCGGCCGG CTGACGGTGC TCGGTTCCCA CCAGATCCCG 
AGCACCCCGT TCCTGCAGGC CTGCGACGCC GTCATCGACG AGCCACCGGG CGAGGGCGAC 
GAGTTCGTCG AGCAGGCACT GGCGGCGTGC CGCCGGCACG GGATCGACGT GTTCGTCCCC 
GGGCGCAACA TGTTGGACGT CGCCGCCCGG GTCGGCGAGT TCGAGGCCGC CGGAGTGCGG 
GTCATGTGCT CCCCAGCCGC CTCGGCGCGG ATCTTCACTA CCAAGTCCGG GCAGTACGCG 
GCGATGGCGG CCCGTGGCCT GCCGGTGCCC CACACCCGGA CGGTGACAAC CTTCGCGGAG 
TTCGAGGCCG CCTGCGACGA GCTGTCGGCC GCGGGCTGCA CGGTCTGCGT CAAACCGGAC 
GTCGACCACG GCGGCCAGGG CTTCCGGATC ATCGACGGGG ACGCCGAGCG CCTGACGGCG 
CTGTTCGAGC CGCCGTCGGT GCGGGTCAGC CCCGCCACCA TGGAACGCAT CCTCGGCCGG 
GCCGGCAGCT TCCCCGCCCT CGTCGTGGGC GAGTTCCTGG ACGGGCCGGA GTTCAGCGTC 
GACGTGCTCT CCCGCCCCGC TCCCGGCACG AGCCCCGCTC CCGGGGCGGG CCCGGTGGCG 
ATGCCCGGCA GTGTCCTGGC GGCGGTGCCG CGGGGCAAGG ACGGCCTGCC CTGGACCCGC 
AACCTGCGGG CGGACGCGGC CGTGACGGAG CTCGCCACCC GCGTCGTCGA GGAGTTCGGG 
TTGGCGTACC TGAACAACGT CCAGGTCCGC TACCGCAGAG CCACGCCGGT GCTGCTCGAG 
GTCAACACGC GGGCCGCCTC CGGGACCTAC CAGTCGGCGG CGGCCGGGCT GAACCTGCCC 
TGGCTCGCGC TCGCGCTCCT GCTCGGGGAG CCGGTAGAGG TGGGCTCGCC GGACCTCCCG 
CAGACGCTCA TCGCCTACAA CGAGGCGATG GTCATGCGCC CGCTCGACCG CCTCTCGCCG 
CGCCCGCGTG GTCACGGCGT GGCCCGGGAC GCCGCCCGTC GGCTGGGCTC GGCCGCCGGC 
CGGGTGCACC GCCGCAGCAC CGGCCCCGAC CGAGCCCAAC CCGCCTGA

Protein sequence

MSAARLWFNQ TWRGTYQLIG LLRDGAGPGR LTVLGSHQIP STPFLQACDA VIDEPPGEGD 
EFVEQALAAC RRHGIDVFVP GRNMLDVAAR VGEFEAAGVR VMCSPAASAR IFTTKSGQYA 
AMAARGLPVP HTRTVTTFAE FEAACDELSA AGCTVCVKPD VDHGGQGFRI IDGDAERLTA 
LFEPPSVRVS PATMERILGR AGSFPALVVG EFLDGPEFSV DVLSRPAPGT SPAPGAGPVA 
MPGSVLAAVP RGKDGLPWTR NLRADAAVTE LATRVVEEFG LAYLNNVQVR YRRATPVLLE 
VNTRAASGTY QSAAAGLNLP WLALALLLGE PVEVGSPDLP QTLIAYNEAM VMRPLDRLSP 
RPRGHGVARD AARRLGSAAG RVHRRSTGPD RAQPA