Gene Franean1_1207 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Franean1_1207
Symbol
ID	5669620
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Frankia sp. EAN1pec
Kingdom	Bacteria
Replicon accession	NC_009921
Strand	+
Start bp	1442981
End bp	1444297
Gene Length	1317 bp
Protein Length	438 aa
Translation table	11
GC content	76%
IMG OID	641240139
Product	competence/damage-inducible protein CinA
Protein accession	YP_001505567
Protein GI	158313059
COG category	[R] General function prediction only
COG ID	[COG1058] Predicted nucleotide-utilizing enzyme related to molybdopterin-biosynthesis enzyme MoeA [COG1546] Uncharacterized protein (competence- and mitomycin-induced)
TIGRFAM ID	[TIGR00177] molybdenum cofactor synthesis domain [TIGR00199] competence/damage-inducible protein CinA C-terminal domain [TIGR00200] competence/damage-inducible protein CinA N-terminal domain

Plasmid Coverage information

Num covering plasmid clones	6
Plasmid unclonability p-value	0.016582
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	12
Fosmid unclonability p-value	0.634024
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCGCGCTG AGCTGCTGGC GGTGGGGGAC GAGCTCCTCT ACGGGGACAT CGTGAACGGC 
AACGCGGCCT GGCTGGGACG CCAGCTCGCC GACGTCGGGG TCGAGGTGGC GACGTCCACC 
GTGGTCGGTG ACCTGATCTC GGACATCGCG ACCGCGATCG GTGTCGCGCT GGGACGCGCC 
GACGCCGTGA TCATGACGGG CGGGCTCGGC CCGACCCAGG ACGACCTGAC CCGCGAGGGG 
ATCGCTCTGG CCGCCGGCGT GGGCCTGCGC CGGGACGAGG TGGAGGAGGC CACCCTGCGC 
CGCCGCTTCG AGGAGCTGGG GCGATCGCGC TCGGGCACGG GGGGCCGTGG GGTCCCCGAG 
ATGAACTTCC GGCAGGCCGA CCTGCCCGTC GGCGCGCAGC CCCTGCCCAA CGGCCCGGGC 
ACCGCACCCG GCGTCCGCAT GGAGATCGGC TCCGGTGTCG TCTACGCCAT GCCCGGCGTC 
CCGTTCGAGA TGCACGACAT GTTCACCCGC AGCGTGCTGC CGGACATCCT GCGCCGGGCC 
GGTCAGCCCG CGGTGGTCGT GCACCGGGTG CTGCGCACGG CGGGCATGTG GGAGTCGATG 
GTCGCCGAGG CGCTCGCGGA CGAGGTCGCG CGGCTCGAGC CGATCGGGAA CCCGCGCATC 
GCGTTCCTCG CCAGCGGCGG CCAGACCCGG GTGCGGATCA CCGCCCGGGC CGCCGACCGG 
GCGGCCGCGG AGACGCTGAT CGCCCCGGTC GAGCAGGCGG CGCGCGCGGC GCTCGGCGCC 
GGCGTCTACG GCGGGGACGA CGAGTCGCTG GAGGGCGTCG TACTGGAGCT GCTGCGGGCC 
GAGGGAGCGA CGCTCGCCGT CGCGGAGTCG CTCACCGGCG GGCTGCTGGC GGGCCGGCTG 
ACGGACGTCC CCGGCGCCAG CTCCGTGTTC CGCGGCGGGG TCGTCTCGTA CGCCACCGAG 
GTGAAGGGGA GCGTGCTCAA CGTCGACCGG GACGTCCTCG CGACCGAGGG TGCGGTCTCG 
TCCGCGACGG CCGAGGCGAT GGCGGCCGGG GCCCGTGACC TGCTCGGAGC CACCTACGGG 
CTCGCCACCA CCGGCGTCGC CGGCCCGGAG GAGCAGGAGG GCAAGCCGGT CGGCACCCTG 
CACGTGGGGC TGGCCGGTCC GGACGGTTCG ACGTCCCGCT CGCTGCGGCT GCCCGGCGAC 
CGGCCGCGGG TCCGCGAGTT CGCCGTCGTG CAGGCCCTGG ACGTGCTGCG CCGTGCCCTG 
GAGGGCCGCC CGGGCGCCAG CGGCTCGAGG CTGCCAGAGC AGGCCCGGGC GCACTGA

Protein sequence

MRAELLAVGD ELLYGDIVNG NAAWLGRQLA DVGVEVATST VVGDLISDIA TAIGVALGRA 
DAVIMTGGLG PTQDDLTREG IALAAGVGLR RDEVEEATLR RRFEELGRSR SGTGGRGVPE 
MNFRQADLPV GAQPLPNGPG TAPGVRMEIG SGVVYAMPGV PFEMHDMFTR SVLPDILRRA 
GQPAVVVHRV LRTAGMWESM VAEALADEVA RLEPIGNPRI AFLASGGQTR VRITARAADR 
AAAETLIAPV EQAARAALGA GVYGGDDESL EGVVLELLRA EGATLAVAES LTGGLLAGRL 
TDVPGASSVF RGGVVSYATE VKGSVLNVDR DVLATEGAVS SATAEAMAAG ARDLLGATYG 
LATTGVAGPE EQEGKPVGTL HVGLAGPDGS TSRSLRLPGD RPRVREFAVV QALDVLRRAL 
EGRPGASGSR LPEQARAH