Gene Franean1_2976 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Franean1_2976
Symbol
ID	5671360
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Frankia sp. EAN1pec
Kingdom	Bacteria
Replicon accession	NC_009921
Strand	+
Start bp	3501695
End bp	3502954
Gene Length	1260 bp
Protein Length	419 aa
Translation table	11
GC content	65%
IMG OID	641241880
Product	Rieske (2Fe-2S) domain-containing protein
Protein accession	YP_001507300
Protein GI	158314792
COG category	[P] Inorganic ion transport and metabolism [R] General function prediction only
COG ID	[COG4638] Phenylpropionate dioxygenase and related ring-hydroxylating dioxygenases, large terminal subunit
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	18
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	22
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCCGCGTT TCCCGAAACC ACCGGAAGGC AGCTGGACAC AGCACTATCC CGCCCTCGGG 
ACGGAACCGG TGTCCTACGA GGACTCCATC TCCCCCGAGT ACTACGAGCG CGAACGGAAG 
GCCGTTTTCA AGCGGGCGTG GTTAAACGTC GGCAGAGCCG AGCAGCTCCC GCGGGTCGGT 
AGCTACTTCA CGAAGGACGT CCACGCCGCC CACGCCTCGA TCATCGTGGT GCGCGGGAAG 
AGCGGGCAGG TCAACGCCTT CCACAACATC TGCCGCCACC GGGGCAACAA GCTCGCGTGG 
ACCGACGACC CGAAACGGGA GACGCAGGGC GTCTGCCGGC AGTTCACCTG CAAGTACCAC 
GGCTGGCGCT ACGATCTCGA CGGTGCGCTG ACCTTCGTCC AGCAGGAGGG CGAGTTCTTC 
GACCTGGACA AGGCCAGCAA CGGCCTGGCG CCGGTGCACT GCGAGGTCTG GGCCGGGTTC 
ATCTTCGTGA ACTTCGCCCG GCAGCCGGAG CAGACGCTGC GCGAGTTCCT CGGGCCGATG 
GTGACGGACC TGGAGGGCTA CCCGTTCGAG AAGCAGACCG CGCGCTTCGG GTACAGCACC 
ACCATCCAGG CGAACTGGAA GCTGTACATG GATGCGTTCG CGGAGTTCTA CCACGCACCG 
GTGCTGCACG CGAAGCAGTC GCCGGAGAAG TACTCCGCGG CCGCCCAGCA GGCCGGTTTC 
GAGGCGCCGC ACTACCAGAT CGAGGGGCCG CACCGGCTGG TCAGCACGTC CGGTGTCCGG 
TTCTGGGAGA TGGACGCCGA GCTGCTCAAG CCGACCGAGA TCCTGACCCG CAGTGGTCTT 
TTCGGCCCGT GGGACAAATA CGACCTGGGT AAGATGCCGC GCGGGGTCAA CCCGGCGGGC 
TGCGACCCCT GGGGCCTCGA CTCCTTCCAG CTCTTCCCGA ACTTCGTGAT CCTCATCTGG 
AGCCAGGGCT GGTACCTCAC CTACCACTAC TGGCCGACGT CCTATAACAC ACACGTGTTC 
GAGGGCAACG TCTACTTCCT GCCGGCCAGA AACATCCGTG AGCGGATCGC GCAGGAGATG 
GCGGCGGTGA CCTTCAAGGA GTTCGCGTTG CAGGACTCGA ACACCCTCGA GGCGACACAG 
ATGATGCTGG AGACCGGGTA CGTCGACCGG TTCCACCTCA ACGACCAGGA AATCCTGTGC 
CGGCATCTGC ACGTCGCGGT GCGCGACTGG GTGAACAACC ACGAGGGGGC GCGTTCATGA

Protein sequence

MPRFPKPPEG SWTQHYPALG TEPVSYEDSI SPEYYERERK AVFKRAWLNV GRAEQLPRVG 
SYFTKDVHAA HASIIVVRGK SGQVNAFHNI CRHRGNKLAW TDDPKRETQG VCRQFTCKYH 
GWRYDLDGAL TFVQQEGEFF DLDKASNGLA PVHCEVWAGF IFVNFARQPE QTLREFLGPM 
VTDLEGYPFE KQTARFGYST TIQANWKLYM DAFAEFYHAP VLHAKQSPEK YSAAAQQAGF 
EAPHYQIEGP HRLVSTSGVR FWEMDAELLK PTEILTRSGL FGPWDKYDLG KMPRGVNPAG 
CDPWGLDSFQ LFPNFVILIW SQGWYLTYHY WPTSYNTHVF EGNVYFLPAR NIRERIAQEM 
AAVTFKEFAL QDSNTLEATQ MMLETGYVDR FHLNDQEILC RHLHVAVRDW VNNHEGARS