Gene Franean1_2078 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Franean1_2078
Symbol
ID	5670479
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Frankia sp. EAN1pec
Kingdom	Bacteria
Replicon accession	NC_009921
Strand	-
Start bp	2503487
End bp	2504542
Gene Length	1056 bp
Protein Length	351 aa
Translation table	11
GC content	73%
IMG OID	641241000
Product	cytochrome oxidase assembly
Protein accession	YP_001506421
Protein GI	158313913
COG category	[O] Posttranslational modification, protein turnover, chaperones
COG ID	[COG1612] Uncharacterized protein required for cytochrome oxidase assembly
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	17
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	12
Fosmid unclonability p-value	0.7047
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGGCGGCGC GCACCCCTTG CCACGGACTC GGGCGGATTA CTATGACCGC GATGCCAACT 
TCTACCGATC GTCGGAGCAA GCCCCGCGAG AGCGGCGGCG CCAGCCAGCC GGACACCACC 
ACCGGCCGGC TGCCGGTGAT CGGGCTGCGC GCCTTCCGCC GGCTGACGCT GGCCAGCGTC 
CTCCTGCTCG CCGCGATCGT GGTGACCGGC GGCGCCGTCC GGCTGACCGG CTCCGGGCTG 
GGCTGCCCCA CCTGGCCGCA GTGCGGCGAC GGCTCCTTCA CCCCGCACTC GGCGTACGCC 
CTCAACGGCG CCATCGAGTT CGGCAACCGG GTCATCAGCA TCGTCGTCGG CCTGGTCGTG 
CTGGCCCTGC CGCTCGCGGC CCGGCGGCTG CGCGAGCCGC GCCGGGACCT GCTGCTGCTC 
TCCCTCGGCC TGTGGCTCGG CTTCGTCGGC CAGGCAGTGC TCGGCGGGAT CACCGTGCTG 
GTGAAGCTGC ACCCGGCCAC CGTCGCCGCG CACTTCCTGC TGTCGATGGT CCTGCTGTTC 
AACGCCGTCG CGCTGCACCG ACGAGCCCGG CAGGCGGCCG GGCCGACTCC GCACGCCGTC 
CGCCCGGAGC TGCTCTGGCT CGCCAGGCTG CTGATGACCG TGGCCGGCGG CGTGCTCGTC 
CTCGGCACCG TCGTGACCGG CACCGGGCCG CACAGCGGCG ACAGCGAGGA CACCAAGCGG 
TTCGGCTTCG ACATCGTCAA CGTCGCCCAG CTCCACGCCG ACGGCGCGAT GATCCTCACC 
GGCCTCACGG TTGCGATGAT CTTCGCCGTC CGGCTGGCAT CCGCCCCGGC GGAGGCCAGC 
CGCAGCGCCA ACGCGCTCGC GCTGACCGTC GTCGCCCAGG CCGCGATCGG CTTCACCCAG 
TACTTCGCCG GCATCCCGCC GCTGCTCGTC GCCCTCCACA TGGCCGGCGC GACCATCATG 
TGGATCGTCA CCGTCCAGCT CTGGCTCGCC ATGAGCGAAC GCCCCCCGGC CGGCGAGAAC 
GCCTGGACGG GCTCCCGCCA ACTCGCCGCC GGTTGA

Protein sequence

MAARTPCHGL GRITMTAMPT STDRRSKPRE SGGASQPDTT TGRLPVIGLR AFRRLTLASV 
LLLAAIVVTG GAVRLTGSGL GCPTWPQCGD GSFTPHSAYA LNGAIEFGNR VISIVVGLVV 
LALPLAARRL REPRRDLLLL SLGLWLGFVG QAVLGGITVL VKLHPATVAA HFLLSMVLLF 
NAVALHRRAR QAAGPTPHAV RPELLWLARL LMTVAGGVLV LGTVVTGTGP HSGDSEDTKR 
FGFDIVNVAQ LHADGAMILT GLTVAMIFAV RLASAPAEAS RSANALALTV VAQAAIGFTQ 
YFAGIPPLLV ALHMAGATIM WIVTVQLWLA MSERPPAGEN AWTGSRQLAA G