Gene Francci3_0541 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Francci3_0541
Symbol
ID	3904192
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Frankia sp. CcI3
Kingdom	Bacteria
Replicon accession	NC_007777
Strand	+
Start bp	626964
End bp	628412
Gene Length	1449 bp
Protein Length	482 aa
Translation table	11
GC content	69%
IMG OID	637877870
Product	NADH dehydrogenase subunit D
Protein accession	YP_479654
Protein GI	86739254
COG category	[C] Energy production and conversion
COG ID	[COG0649] NADH:ubiquinone oxidoreductase 49 kD subunit 7
TIGRFAM ID	[TIGR01962] NADH dehydrogenase I, D subunit

Plasmid Coverage information

Num covering plasmid clones	15
Plasmid unclonability p-value	0.482391
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	9
Fosmid unclonability p-value	0.20204
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACGACCA ACACGTCGAC TTCCTCCACC ACGGACGATC TGACCACCGG GGCTCCCAAC 
GGCACCGGGG CCCCCGACGG CGCGAACGGC GTCGGGGGCC CGACCGGGAC CGTCGGCGGA 
CCCGGGGAGC ATCCGGCCTA CGAGGCCGGC TTCACCGAGT CGGCGAACGG GCGGGTCTAC 
ACCGTCACCG GCAGCGACTG GGAGCAGATC CTCGGCGTCG GCGAGGAGGA GAACGAGCGG 
ATCGTCGTCA ACATGGGGCC GCAGCACCCG TCGACCCACG GGGTGCTCCG CCTGGTCCTG 
GAGATCGAGG GCGAGACGGT CACCGAGACC CGCCTCGTCA TCGGCTACCT GCACACCGGC 
ATCGAGAAGA GCTGTGAGTA CCGCACCTGG ACTCAGGCGG TCACCTTCCT CACCCGGGCG 
GACTACCTCT CGCCGCTGTT CAACGAGGCG GCCTACTGCC TGTCGGTGGA GAGGCTGCTG 
GGCATCACCG AGCAGGTACC CGAGCGGGCC ACGGTGATCC GGGTGATGGT GATGGAGCTC 
CAGCGGATCG CCTCGCACCT GGTGTGGCTC GCGACCGGCG GCATGGAGCT CGGCGCCACC 
ACCGCCATGA TCTTCGGTTT CCGGGAGCGG GAGAAGGTCC TCGACCTGCT CGAGCTCATC 
ACCGGGCTGC GGATGAACCA CGCCTACATC CGGCCCGGGG GCCTCGCCCA GGATCTCCCC 
GACGGCGCCG AGCGGGCCAT CCGGGCGTTC CTCGCGGACA TGCCGAAGCG GATCAGGGAG 
TATCACGCGC TGCTCACCGG CCAGCCAGTC TGGAAGGCCC GGATGGTCGA CGTCAACGTT 
CTCGACGCGG CCGGCTGCAT CGCGCTGGGG ACCACGGGCC CGGTGTTGCG CGCCGCGGGC 
CTGCCGTGGG ACCTGCGCAA GACCATGCCC TACTGCGGCT ACGAAACCTA CGAGTTCGAC 
GTGCCGACCG CGCTGGAGGG CGACTCCTTC GCCCGCTACC TGGTGCGGCT GGAGGAGATG 
GGCGAGTCAC TCAAGATCGT TGATCAGTGT CTGGACCGGC TGCGTCCCGG CCCGGTCATG 
GTCGCCGACA AGAAGATCGC CTGGCCGTCC CAGCTTTCTG TCGGGTCCGA CGGGACGGGC 
AACTCACTCG CGTACATCCG GAAGATCATG GGGACCTCGA TGGAGGCCCT GATCCATCAC 
TTCAAGCTGG TGACCGAGGG ATTCCGCGTC CCGGCCGGTC AGGTCTACAC CCAGATCGAG 
TCGCCGCGCG GAGAGCTCGG CTACCACGTG GTCAGCGACG GCGGCACGAG ACCCTTCCGC 
GTCCACGTGC GGGATCCAAG CTTCGTCAAC CTGCAGGCCG TCCCGGCGCT GACCGAGGGC 
GGCCAGGTGG CGGACGTGAT CGTCGGGGTC GCCTCAGTCG ACCCGGTGCT CGGGGGAGTT 
GATCGTTGA

Protein sequence

MTTNTSTSST TDDLTTGAPN GTGAPDGANG VGGPTGTVGG PGEHPAYEAG FTESANGRVY 
TVTGSDWEQI LGVGEEENER IVVNMGPQHP STHGVLRLVL EIEGETVTET RLVIGYLHTG 
IEKSCEYRTW TQAVTFLTRA DYLSPLFNEA AYCLSVERLL GITEQVPERA TVIRVMVMEL 
QRIASHLVWL ATGGMELGAT TAMIFGFRER EKVLDLLELI TGLRMNHAYI RPGGLAQDLP 
DGAERAIRAF LADMPKRIRE YHALLTGQPV WKARMVDVNV LDAAGCIALG TTGPVLRAAG 
LPWDLRKTMP YCGYETYEFD VPTALEGDSF ARYLVRLEEM GESLKIVDQC LDRLRPGPVM 
VADKKIAWPS QLSVGSDGTG NSLAYIRKIM GTSMEALIHH FKLVTEGFRV PAGQVYTQIE 
SPRGELGYHV VSDGGTRPFR VHVRDPSFVN LQAVPALTEG GQVADVIVGV ASVDPVLGGV 
DR