Gene Francci3_2543 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Francci3_2543
Symbol
ID	3904687
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Frankia sp. CcI3
Kingdom	Bacteria
Replicon accession	NC_007777
Strand	+
Start bp	3005612
End bp	3006751
Gene Length	1140 bp
Protein Length	379 aa
Translation table	11
GC content	67%
IMG OID	637879870
Product	radical SAM family protein
Protein accession	YP_481636
Protein GI	86741236
COG category	[R] General function prediction only
COG ID	[COG0535] Predicted Fe-S oxidoreductases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	20
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	15
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACCACCT TCCTTGATCT TCCCCACCTG CGCCCGAGGG ACGACTATGG CCACGCCCGG 
ATGCCGCGCC GGGCTGACGC ACCTGCCCCG GAACACATTG ACCGGATCGC CTACGGCCGG 
TTCCGGAATG TGTACCTCTA CATCACCGAG GCCTGTCAAC TGCGCTGTGA ACACTGCTAC 
ATGGGCGAAC GACTGGAGCG CGCCTTGAAG ATGCCGTTGC CCCAGATCAC GGAGACGCTG 
CGGACCTGGC GACGGATGGG CGGCAGCAAG CTGACCATCC TGGGCGGGGA GCCGACGCTT 
CACCCCAACT ACATCGAGGC CATCCGGCTC GGGCGGCAGC TGGGGTACGA GGACGTCATC 
ACCACCACGA ACGCCCAGAA GCCCGCGGCA CGGAAGTTCC GCCAGCTGGA ACCGGCGGAC 
TTCGCCTACG TCCAGGTCAG CCTCGACGGC GGGAGCGCCG CCACCCACGA CCAGGTACGC 
GGCGAGGGCA CCTTTGACGT GGCTCTGGAG ACGACGGCGG AGCTGGCCGG ACGCGGCTTC 
GACACCCGGA TCATCTGCAC CGTCAACCGG GCCAACCGGG GCGACGCCCT GAAGCTGTTG 
GACCTGGCCG ACGAGATCGG CGTGTCCCTC GTGAAGTTCC ACGTCTTCTC CACCATCGGC 
ACCGGCCACG GCAACGCCGA CATGGCGATG GGTCCATCAG CCTGGGTGAC GTACTGCGAC 
GTCATCAACC AGGTGGCCCC GGCCTACAAA ACCCGGGTCT GGTACCAGCC CACCTACGCC 
CGGCGAAACC AGATGAGCCG CTATGCGGCG GAGGGATACC AGGGGTGCAT CGGCCGGACG 
CTGGACCGCA TTTCGATCTT TCCCGACGGG CGCTGCTACG TCTGTTCGTA CCTGTTCGAC 
ACGGACCTCA ACTTCGCCCG GATGCAGGAC GGGCAGGTGG TGTTGAACCG CGAGGCCAAC 
GAGTTCGACC TGTTCACCCA ACCGCTGATG ACGAGCGCGT GCGGCGGGTG CAAGGCCTCC 
GCCTGCCAGG GCGGTTGCCC CGCCGAGGAA GTCGTCATGG GCGGCTCCTC CTGCGCCGCG 
GAGCCGGACA TCGTGCCGGT GTGCCGGTTG TGGAAGTCGT CCGCCAAGCC CGAGGACTGA

Protein sequence

MTTFLDLPHL RPRDDYGHAR MPRRADAPAP EHIDRIAYGR FRNVYLYITE ACQLRCEHCY 
MGERLERALK MPLPQITETL RTWRRMGGSK LTILGGEPTL HPNYIEAIRL GRQLGYEDVI 
TTTNAQKPAA RKFRQLEPAD FAYVQVSLDG GSAATHDQVR GEGTFDVALE TTAELAGRGF 
DTRIICTVNR ANRGDALKLL DLADEIGVSL VKFHVFSTIG TGHGNADMAM GPSAWVTYCD 
VINQVAPAYK TRVWYQPTYA RRNQMSRYAA EGYQGCIGRT LDRISIFPDG RCYVCSYLFD 
TDLNFARMQD GQVVLNREAN EFDLFTQPLM TSACGGCKAS ACQGGCPAEE VVMGGSSCAA 
EPDIVPVCRL WKSSAKPED