Gene Franean1_2283 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Franean1_2283
Symbol
ID	5670682
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Frankia sp. EAN1pec
Kingdom	Bacteria
Replicon accession	NC_009921
Strand	+
Start bp	2727364
End bp	2728785
Gene Length	1422 bp
Protein Length	473 aa
Translation table	11
GC content	75%
IMG OID	641241203
Product	amidohydrolase
Protein accession	YP_001506624
Protein GI	158314116
COG category	[F] Nucleotide transport and metabolism [R] General function prediction only
COG ID	[COG0402] Cytosine deaminase and related metal-dependent hydrolases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	11
Plasmid unclonability p-value	0.442261
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	11
Fosmid unclonability p-value	0.362422
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGACCCCAC CACCGGCGGG TCCCGCTCCG CTGCCCGCCG ACTTCGTCGT GCGGGCCCGG 
CACGTCCTGA CCATGGGGCC CCGCGGCCAC CTGCGGGACG CCGCGGTCGC CGTCGTCGGT 
GGGCGGATCG CCGCCGTCGA CACCGCGGCG GACGTCCGGG CGCGGTTCGC GGACCTGCCG 
GTGGTCGGGG ACGGCGGCGG GATCCTGATC CCGGGGCTGG TCAGCGCGCA CGGGCACTTC 
TCCGAGGGGC TCGTCACCGG CATCGGTGAG ACGCACACGC TGTGGGAGTG GTTCGTCCGC 
GTCGTCGAGC CCATCGAGGG GCACCTCACC CGGGACATGG CCTACGTCGG GACGCTGCTC 
AAGGCGGCCG AGCTGGCCTG TTCCGGGGTG ACGACGGTCG CAGACATGTT CTGCTCGGCG 
GCCGGGGCCA CCCCGGTCAC CCCCGGGGTG GTCGACGCCC TCGACGCCGT CGGCCTACGC 
GGCGATGTGT CGTTCGGCCC GGCGGACTCG GCGAACCCCC GGCCGGTCGC GGCCGTCCTC 
GCCGAGCACG CGGCGCTCGC CGACGCGGCC CGCAACTCCC GCCGGACCAC CTTCCGGGTG 
GGCCTGGCGA CCGTGCCGTC GAGCAGCGAC GAGCTGCTCG ACGAGACGGC CCGGCTGGTC 
GCGCAGACCG GCCGGCTGCA CGTCCACCTG CACGAGATCC GCGAGGAGGT GACCGCGTCG 
CGGACGACGC GCGGCACCGG GTCGATCGAG TTCGCCGCGC GGCGCGGGCT GCTCGACGCG 
CAGGTCGTGG CCGCGCACTG CGTGTGGCTC GACGACACCG ACGTAGAACT GCTGCGCCGG 
CACCGGGTCG CGGTCGCGCA CTGCCCCGTC TCGAACATGA TCCTCGCCAG CGGGGTGTGC 
CAGGTCCCGC GGCTGCTGCG CGACGGGTTC ACCGTCGCGC TCGGCGTGGA CGGCGCGGCG 
AGCAACGACA GCCAGAACAT GCTGGAGACG ATGAAAATCG CCGCCCTGCT GCAGAAGGTG 
CACCACCTGC AGGCGACGGC CCTGACGGCG CCGACGGTGC TGCGGATGGC GACCATCGAG 
GGTGCGCGGG CGCTCGGGCT CGCCGACGAG GTCGGCTCCC TGGAGGTCGG CAAGGCCGCC 
GACCTGGTCT ACCTCGCCGA GGCGAGCCCG TCGCTGGCGC TCGTGCACGA CCCCTACCAG 
GCGGTTGTCT ACTGTGCCTC CCCGCGGGAC GTCACCGGGG TGTGGGTGGC CGGTGAGCGG 
GTCGTCGCCG ACGGGCGGCT GGTCGCCGTC GATCTCGGGC CGGTCCTGCC GTGGGCGCGT 
GAGCTGGCCG TCGAGCTCGC CAGCCGGGCC GGGCTGGACT CCGAGCTGCG CTCCGCCGCG 
GCCGGCCCGC CAGTGGAAGT GGTGCCCGGC GCGGCGCGGT GA

Protein sequence

MTPPPAGPAP LPADFVVRAR HVLTMGPRGH LRDAAVAVVG GRIAAVDTAA DVRARFADLP 
VVGDGGGILI PGLVSAHGHF SEGLVTGIGE THTLWEWFVR VVEPIEGHLT RDMAYVGTLL 
KAAELACSGV TTVADMFCSA AGATPVTPGV VDALDAVGLR GDVSFGPADS ANPRPVAAVL 
AEHAALADAA RNSRRTTFRV GLATVPSSSD ELLDETARLV AQTGRLHVHL HEIREEVTAS 
RTTRGTGSIE FAARRGLLDA QVVAAHCVWL DDTDVELLRR HRVAVAHCPV SNMILASGVC 
QVPRLLRDGF TVALGVDGAA SNDSQNMLET MKIAALLQKV HHLQATALTA PTVLRMATIE 
GARALGLADE VGSLEVGKAA DLVYLAEASP SLALVHDPYQ AVVYCASPRD VTGVWVAGER 
VVADGRLVAV DLGPVLPWAR ELAVELASRA GLDSELRSAA AGPPVEVVPG AAR