Gene Franean1_6091 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Franean1_6091
Symbol
ID	5674412
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Frankia sp. EAN1pec
Kingdom	Bacteria
Replicon accession	NC_009921
Strand	-
Start bp	7415429
End bp	7416802
Gene Length	1374 bp
Protein Length	457 aa
Translation table	11
GC content	69%
IMG OID	641244943
Product	NADH dehydrogenase subunit D
Protein accession	YP_001510341
Protein GI	158317833
COG category	[C] Energy production and conversion
COG ID	[COG0649] NADH:ubiquinone oxidoreductase 49 kD subunit 7
TIGRFAM ID	[TIGR01962] NADH dehydrogenase I, D subunit

Plasmid Coverage information

Num covering plasmid clones	11
Plasmid unclonability p-value	0.489458
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	5
Fosmid unclonability p-value	0.0112827
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAGCACGC ACACCGAGAC GCCCGTCGAC GGTTCGGCCG AGACCATCAC CGGCGCGCAG 
CCCTACGAGG CCGGGTTCAC CGAGTCCTCC GCCGGCCGCG TCTACACCGT GACGGGCGGT 
GACTGGGAGC AGGTCCTCGG CGTCGGCGAG GACGACGGTG AGCGGATCAC CGTCAACATG 
GGCCCGCAGC ACCCGTCCAC CCACGGCGTG CTGCGGCTGG TGCTGGAGAT CGAGGGCGAG 
ACGGTTACCG AGACCCGCCT GGTCATCGGC TACCTGCACA CCGGGATCGA GAAGAGCTGC 
GAGTACCGCA CCTGGACGCA GGCGGTCACG TTCCTCACCC GCGCCGACTA CCTCTCGCCG 
CTGTACAACG AGGCGGCGTA CTGCCTGTCG GTGGAGAAGC TGCTCGGCAT CACCGGCGAG 
GTGCCGGAGC GGGCGACCGT CATCCGGGTG CTCGTCATGG AGCTGCAGCG GATCGCCTCG 
CACCTGGTGT GGCTGGCGAC CGGAGGCATG GAGCTCGGCG CCACCACCGG CATGATCTTC 
GGGTTCCGTG AGCGGGAGAA GATCCTCGAC CTGCTCGAGA CGATCACCGG CCTGCGGATG 
AACCACGCCT ACATCCGCCC CGGCGGCCTG GCCCAGGACA TCCCGGACGA GGTGATCCCG 
GAGATCCGCG CGTTCCTCGA CTACATGCCC AAGCGCATCC GCGAGTACCA CGCGCTGCTG 
ACCGGCCAGC CCATCTGGAA GGCGCGGATG GTCGACGTCA ACTTCCTCGA CGCCGCCGCC 
TGCCTCGCGC TGGGGACGAC CGGCCCGGTG CTGCGCGCCG CCGGTCTGCC CTGGGACCTG 
CGCAAGACCA TGCCGTACTG CGGCTACGAG ACCTACGAGT TCGACGTCCC GACCGCGCTC 
GAGGGCGACT CCTACGCCCG GTACCTGGTG CGGATCGAGG AGATGGGCGA GTCCCTCAAG 
ATCATCGAGC AGTGCCTGGA CCGGCTGCGC CCCGGCCCGG TCATGGTCGC CGACAAGAAG 
ATCGCCTGGC CGTCGCAGCT GGCCATCGGC TCGGATGGCA TGGGCAACTC GCTCGAGTAC 
ATCCGCAAGA TCATGGGGAC CTCGATGGAG GCCCTGATCC ACCACTTCAA GCTCGTCACC 
GAGGGCTTCC GGGTGCCCGC CGGCCAGGTG TACACGCAGA TCGAGTCGCC GCGCGGCGAG 
CTCGGCTACC ACGTCGTCAG CGACGGCGGC ACCAGGCCGT TCCGCGTCCA CGTGCGGGAC 
CCAAGCTTCG TGAACCTGCA GGCCGTGCCC GCGCTGACGG AGGGCGGGCA GGTGGCCGAC 
GTGATCGTCG GCGTCGCCTC CGTCGACCCG GTGCTCGGGG GAGTTGATCG CTGA

Protein sequence

MSTHTETPVD GSAETITGAQ PYEAGFTESS AGRVYTVTGG DWEQVLGVGE DDGERITVNM 
GPQHPSTHGV LRLVLEIEGE TVTETRLVIG YLHTGIEKSC EYRTWTQAVT FLTRADYLSP 
LYNEAAYCLS VEKLLGITGE VPERATVIRV LVMELQRIAS HLVWLATGGM ELGATTGMIF 
GFREREKILD LLETITGLRM NHAYIRPGGL AQDIPDEVIP EIRAFLDYMP KRIREYHALL 
TGQPIWKARM VDVNFLDAAA CLALGTTGPV LRAAGLPWDL RKTMPYCGYE TYEFDVPTAL 
EGDSYARYLV RIEEMGESLK IIEQCLDRLR PGPVMVADKK IAWPSQLAIG SDGMGNSLEY 
IRKIMGTSME ALIHHFKLVT EGFRVPAGQV YTQIESPRGE LGYHVVSDGG TRPFRVHVRD 
PSFVNLQAVP ALTEGGQVAD VIVGVASVDP VLGGVDR