Gene Franean1_4000 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Franean1_4000
Symbol
ID	5672360
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Frankia sp. EAN1pec
Kingdom	Bacteria
Replicon accession	NC_009921
Strand	-
Start bp	4783419
End bp	4784387
Gene Length	969 bp
Protein Length	322 aa
Translation table	11
GC content	73%
IMG OID	641242878
Product	Rieske (2Fe-2S) domain-containing protein
Protein accession	YP_001508295
Protein GI	158315787
COG category	[P] Inorganic ion transport and metabolism [R] General function prediction only
COG ID	[COG2146] Ferredoxin subunits of nitrite reductase and ring-hydroxylating dioxygenases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	20
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	12
Fosmid unclonability p-value	0.649548
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCGCGGAT CCGAACGGCT GCTCGATCGG CTTGAGCGAG AGCAGAGGCT TGATGCCCCT 
GCGGAGGCAG TCTCGGGCTT CTGGTCGGCG GCGCTGCGCT CCGAACGGTT GCGCGATGTG 
CTCAGCGGCC GGCAGCTCGG GCATCCGCTG CATCCCGCGG CGATCCTCGT CCCGGCGGGG 
ACGCTGCTGA GCGCGACGAT GCTGGACACC ACTGGTGGCG CCGCCCTCCG CCCGGCCGCG 
CGACGGCTCG TCGGACTCGG CCTGCTGTCG GCCGGACCAG CCGCGCTCGC CGGGTGGTCG 
GACTGGCTCG ACACGAAGGG CGCCGAGCGC CGAGTCGGGC TCGTCCACGC CGCTTCCAAC 
GTGGTGGGAC TCGCAAGCTA CGCGATCTCA TGGCGCCAGC GTCGTCGCGG CGCGCGTGGG 
CTGGCCGCCA GTCTCGCGGG TGCGGCCGCC CTCGGCCTCG GCGGCTGGTT GGGTGGTCAC 
CTCGCCTACG CGCTGGGGGT GGGGGTGGAC ACCACCGCGT TCCAGCGGGG GCCGGCCGAG 
TGGACGGACG TGCTGGCGAC CAGCGAGGTC ACCACGGAAC TGCGGCAGGT CGAGATCGAT 
GGGGTGCCGG TGCTGCTGAC CAGGGTCAAC GGTCAGGTCG TCGCGATCAG TGACCGCTGT 
ACCCACCGGG GAGGCCCGCT GCACGAGGGC GAGCGCACCG GCGGCTGCGT GCGCTGCCCC 
TGGCACGGAA GCCAGTTCGA GTTGGCCTCC GGCGAGGTCG TCCAGGGCCC CGCCACCCGT 
CCGCAGCCGG TCTACGAGGT CCGCGAGACC GGCGGGCGGG TCGAACTCCG CCGCTCAGAG 
GTCCGGACCC TACGCGCCAA CCCCGTCGGA CCGTCGCCCA GCCCGGACGC ACGGCTCCGG 
ATCTCGACCG AAGGCCAGGC GGTGACCAGC GCGGCCATGC ATCGCACGAG CCAGCACGGA 
ATATGGTAG

Protein sequence

MRGSERLLDR LEREQRLDAP AEAVSGFWSA ALRSERLRDV LSGRQLGHPL HPAAILVPAG 
TLLSATMLDT TGGAALRPAA RRLVGLGLLS AGPAALAGWS DWLDTKGAER RVGLVHAASN 
VVGLASYAIS WRQRRRGARG LAASLAGAAA LGLGGWLGGH LAYALGVGVD TTAFQRGPAE 
WTDVLATSEV TTELRQVEID GVPVLLTRVN GQVVAISDRC THRGGPLHEG ERTGGCVRCP 
WHGSQFELAS GEVVQGPATR PQPVYEVRET GGRVELRRSE VRTLRANPVG PSPSPDARLR 
ISTEGQAVTS AAMHRTSQHG IW