Gene Franean1_2493 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Franean1_2493
Symbol
ID	5670889
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Frankia sp. EAN1pec
Kingdom	Bacteria
Replicon accession	NC_009921
Strand	-
Start bp	2970877
End bp	2971932
Gene Length	1056 bp
Protein Length	351 aa
Translation table	11
GC content	69%
IMG OID	641241410
Product	NADH ubiquinone oxidoreductase 20 kDa subunit
Protein accession	YP_001506831
Protein GI	158314323
COG category	[C] Energy production and conversion
COG ID	[COG1740] Ni,Fe-hydrogenase I small subunit
TIGRFAM ID	[TIGR00391] hydrogenase (NiFe) small subunit (hydA)

Plasmid Coverage information

Num covering plasmid clones	11
Plasmid unclonability p-value	0.248726
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	17
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGTCCACAG TCGAGGATCC GATCCACATT CTCTGGATCA ACGCCGGACT CAGCTGCGAC 
GGGGACTCGG TCGCGCTCAC CGCAGCCACC CAGCCCAGCA TCGAGGACAT CGTTCTGGGC 
ACCCTGCCGG GCCTGCCGAA GGTCAGCGTC CACTGGCCGC TCATCGATTT CGAGTCCGGG 
CCGGAGCAGG GCGCCGACAC CTTCATCGAC TGGTTCCGCA GGGCCGACCA CGGCGAGCTC 
GATCCGTTCG TCCTGGTCGT CGAGGGGTCC ATTCCGAACG AGGACCTGAT CACGAACGGC 
GGCTACTGGA GCGGTTTCGG GAACGACCCG GTGACCCGCC AGCCGGTGAC GACCAGCACC 
TGGCTCGACC GGCTCGCGCC GAAGGCGCTG GCGATCCTCG CCGCGGGAAC GTGCGCCACC 
TACGGCGGCA TCCACGCGAT GGCCGGGAAT CCGACCGGGG CGATGGGGGT GCCCGACTAT 
CTCGGCTGGG ACTGGAAGTC GAAGGCGCAG ATCCCGATCG TGTGCGTTCC GGGCTGCCCC 
GTCCAGCCGG ACAACCTGTC GGAGACGATC ACCTACCTGC TCTACCAGGC GAGCGGGCAG 
GCGCCGATGA TCCCCCTCGA CGACCAGCTC CGCCCGCGCT GGCTGTTCGG CGCCACCGTG 
CACCAGGGCT GCGACCGGGC CGGGTACTAC GAGGAAGGTC AGTTCACCAC GGAGTACGGC 
ACCCCGCAGT GCCTGGTGAA GATCGGCTGC TGGGGCCCGG TGGTGAAGTG CAACGTCCCC 
AAGCGCGGCT GGATCAACGG GGTGGGCGGC TGCCCGAACG TCGGCGGGAT CTGCATCGCA 
TGCACGATGC CGGGCTTCCC GGACCGTTTC ATGCCGTTCA TGGACGAGCC GCCCGGCGCC 
CACATCTCGA CCACCGCGAG CGGCCTGTAC GGCGCGGTCA TCCGCAGACT GCGCGCCATC 
ACGATGCGTA AGGCGGACGT CGAACCGCGC TGGCGGCGCC GGGACGTCCA CGCAGGCCAG 
GACGACGATC GCGCGCGGGA GAAGGTGCTG ACATGA

Protein sequence

MSTVEDPIHI LWINAGLSCD GDSVALTAAT QPSIEDIVLG TLPGLPKVSV HWPLIDFESG 
PEQGADTFID WFRRADHGEL DPFVLVVEGS IPNEDLITNG GYWSGFGNDP VTRQPVTTST 
WLDRLAPKAL AILAAGTCAT YGGIHAMAGN PTGAMGVPDY LGWDWKSKAQ IPIVCVPGCP 
VQPDNLSETI TYLLYQASGQ APMIPLDDQL RPRWLFGATV HQGCDRAGYY EEGQFTTEYG 
TPQCLVKIGC WGPVVKCNVP KRGWINGVGG CPNVGGICIA CTMPGFPDRF MPFMDEPPGA 
HISTTASGLY GAVIRRLRAI TMRKADVEPR WRRRDVHAGQ DDDRAREKVL T