Gene Francci3_1965 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Francci3_1965
Symbol
ID	3903673
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Frankia sp. CcI3
Kingdom	Bacteria
Replicon accession	NC_007777
Strand	-
Start bp	2306248
End bp	2307450
Gene Length	1203 bp
Protein Length	400 aa
Translation table	11
GC content	68%
IMG OID	637879302
Product	cytochrome P450
Protein accession	YP_481069
Protein GI	86740669
COG category	[Q] Secondary metabolites biosynthesis, transport and catabolism
COG ID	[COG2124] Cytochrome P450
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	24
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	17
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGCGGATC CCGTGGTGAC CGACGTCGGG ACGTCGGCAC GCAAGATCGA CCGCGAAGAC 
CCGAACGGCG GATGCCCGGT CGTACAGGGC GCCGACGGCG TATGGCGGAT CAGCGGGTAC 
GCCGCCGGGC AGGCGGTGCT GCGCAGCTTG GAAACCAAGC AGGCCGGCCT CGGTATCGAC 
GCATCTAAGG CGATTCCCAA GCGGATCCGC CGACCGGTGC TGCACAGCGA CGGCCCCGAG 
CACCGGGAAC GCCGCCGGCT GACCGCACGA TTCTTCACTC TACGCAGGGT CGACGAGCAC 
TACCGCGAGC TGATGCACCG CGTCGCCGAC GAGCAGATCG ACCGGTTGCG CCGCGAGCGG 
AGCGTCGACC TGTCCGAGCT CAGCTTCGCC CTCGCCGTCG AGGTCGCCGC CGCGGTGATC 
GGCCTCACCA ACAGCCGCCC CGGCATGGCC GCCCGCCTGG AACGGTTCGC CCAGGGAGAC 
CTCGGACCGC CGAATGTCAC CAGCATCCGC GGCATCAGGC AGTTCATCCG GCAGAACCGC 
CACGCCCTCG CCTTCTACCT CGCCGACGTG CGCCCCGCGG TACGCGCCCG CCGTCGGCGA 
CGCACGGATG ACCTCATCTC ACACATGATC GACCAAGGCT GCACCAATGC CGAAATCTTC 
GCCGAGTGCG TCACCTTCGC ACCCGCAGGA ATGATCACCA CCCGGGAGTT CATCAACGTC 
GCCGCCTGGC ACCTGTTCAC CGACGACACA CTGCGCGCCC GCTACCACGA CGCTGACCAG 
ACCGAACGGA TCGCGATCCT GCACGAGTTC CTGCGCTTGG AACCGGTCAT CTCCACTCTC 
AAACGGCGCA CGACGGCCGA CATCCAGCTA CCGGGCCCGC ACGGCCCGCT AACGATCCCA 
GCCGGCGCCC AGATCGACAT CGCGGTGAGC AGCACCAACA TCGACACGCA GGCCATCGGC 
GCCGACCCGT ACACAGTCCG CCCCGCCCGC CCGATCGGCG ACGGCGTGAG TCCGGCGGGG 
CTGAGCTTCG GCGACGGCCC CCACAAATGC CCCGGCGCAC ACGTCGCCAT CCACGAAACC 
GACATCTTCC TGCACAAGCT GTTCATGCTC GACGGCCTGC ACATGGCCAG CCCACCCCAG 
GTCACCCTCC GGGACGAGAT CGCGGCCTAC GAGCTGCGCG GCCTCGTCGT CACGCTCGAC 
TGA

Protein sequence

MADPVVTDVG TSARKIDRED PNGGCPVVQG ADGVWRISGY AAGQAVLRSL ETKQAGLGID 
ASKAIPKRIR RPVLHSDGPE HRERRRLTAR FFTLRRVDEH YRELMHRVAD EQIDRLRRER 
SVDLSELSFA LAVEVAAAVI GLTNSRPGMA ARLERFAQGD LGPPNVTSIR GIRQFIRQNR 
HALAFYLADV RPAVRARRRR RTDDLISHMI DQGCTNAEIF AECVTFAPAG MITTREFINV 
AAWHLFTDDT LRARYHDADQ TERIAILHEF LRLEPVISTL KRRTTADIQL PGPHGPLTIP 
AGAQIDIAVS STNIDTQAIG ADPYTVRPAR PIGDGVSPAG LSFGDGPHKC PGAHVAIHET 
DIFLHKLFML DGLHMASPPQ VTLRDEIAAY ELRGLVVTLD