Gene Francci3_0550 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Francci3_0550
Symbol
ID	3904201
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Frankia sp. CcI3
Kingdom	Bacteria
Replicon accession	NC_007777
Strand	+
Start bp	638324
End bp	640012
Gene Length	1689 bp
Protein Length	562 aa
Translation table	11
GC content	69%
IMG OID	637877879
Product	NADH dehydrogenase subunit M
Protein accession	YP_479663
Protein GI	86739263
COG category	[C] Energy production and conversion
COG ID	[COG1008] NADH:ubiquinone oxidoreductase subunit 4 (chain M)
TIGRFAM ID	[TIGR01972] proton-translocating NADH-quinone oxidoreductase, chain M

Plasmid Coverage information

Num covering plasmid clones	20
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	10
Fosmid unclonability p-value	0.291589
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCACACAG TCCCCTGGTT GACGATCATG TTGATCGTCC CGGCCGCGGG TGCGGTGGTC 
GTCGCCGCTC TGCCCCGCCG GCTGTCGACC CTCGCCAAGC AGCTCACCCT CGGGCTCTCG 
CTGGCGGTTC TGGTGCTCGC GGTCCTTGCG ACCGCGGCCT ACAACCCGGA CAAGGCCGGC 
TTCCAGTTCG CCCAGTCCTA CGACTGGATC AAAACCTTCG GCATCTCCTA CTCGGTGGGG 
GCCGACGGCA TCTCGCTGGT GCTGATCCTG CTTGCCGCGC TGCTGGTGCC GGTCGTGGTC 
CTGGCGTCCT GGGACGAGGC AGGCGCGGAT GGCGGGACGA CCGGTGCGAC GGATCCGACC 
GGCGCGGCCG CCGTCGGCGC GGCCGCCGTC GGGGTGGACG GCGCCGGGGT GGACGGCGCC 
GGGGTGGACG GCGCCGGGGT GGACGGCGCC GGGACGCGGA GCAGGCGGTC GGTCCCGGCG 
TTCTTCGCGC TGCTGCTGGC GCTGGAGGCC GGGATGATCG GCGTGTTCGC CGCTACCGAC 
GTCTTCCTGT TCTACGTCTT CTTCGAGGCG ATGCTCATCC CGATGTACTT TCTCATCGGG 
AGCTACGGCC CGGTCCGGGA GCAGGCCCAG CGCTCCTACG CGGCGGTCAA GTTCCTGCTC 
TACAGCCTCT TTGGCGGCCT GCTGATGCTC GCTGCCGTGA TCGGACTGTA CGTCGTCTCC 
GCCGACAACC TCGGCAGCGG AACCTTCGAC TTCGCCACCC TGCGGCAGAT GGACATCACC 
CCCGGGGTGC AGAAGCTGCT GTTCCTCGGT TTCTTCCTGG CGTTCGCCAT CAAGGCCCCC 
CTGTTCCCGT TCCACACCTG GCTGCCCGAC GCCGGCGCGC AGTCGCCCAC CGGCGGCGCG 
GTGCTGCTGG TCGGGGTGCT GGACAAGGTG GGCACGTTCG GACTGATCCG GTACTGCATC 
CCGCTGTTTC CCGACGCGGC CGACTACTTC GCCCCGCTGG TGCTTGGTCT GGCGGTGATC 
GGCATCTTCT ACGGCGCCCT GCTCGCCATC GGGCAGCGGG ACATGAAACG GCTGGTCGCC 
TACACCTCGC TGGCCCACTT CGGCTTCATC GCGCTGGGCA CCTTCGCCTT CACCTCCCAG 
GCGGGCAGCG GCGCGGTGCT TTACATGGTC AACCACGGCC TGTCCACCGG CCTGCTTTTC 
ATGGTCGTGG GCTTCCTGGT GGCGCGCCGC GGCACTCGTG ACGTCGGTGC TTACGGCGGC 
CTGGCCAGGG TGACGCCGGT GCTTGCCGGG GTGTTCCTCG TCGCCGGACT GTCGTCGTTG 
GCGTTGCCTG GAACGAACAG CTTCGTCAGC GAGTTCCTGG TGCTGGTGGG GACGTTCACC 
CGGAACAGGC CGCTGGCGAT CGTCGCGACC ACCGGCATCG TGCTGGCCGC GATCTACATC 
CTGTACCTCT ACCAGCGGAC GATGACCGGA CCGGTGGTGC ACGAGGAGAA CAAGGTCCTG 
GTCGACCTCA GCCTGCGCGA GAAGCTCGTC GTCGCCCCGA TGGTCGCGCT CATCGTCGCG 
CTCGGGGTCT ACCCCAAGCC GCTGCTCGAC ATCATCACGC CGACGGTGAC GGCGACCTAC 
GCCGATATCG GCAAGTCTGA CCCGGCTCCG ACGCACTCGG TGGCCGCGGA GTCCGGAGGC 
CACTCGTGA

Protein sequence

MHTVPWLTIM LIVPAAGAVV VAALPRRLST LAKQLTLGLS LAVLVLAVLA TAAYNPDKAG 
FQFAQSYDWI KTFGISYSVG ADGISLVLIL LAALLVPVVV LASWDEAGAD GGTTGATDPT 
GAAAVGAAAV GVDGAGVDGA GVDGAGVDGA GTRSRRSVPA FFALLLALEA GMIGVFAATD 
VFLFYVFFEA MLIPMYFLIG SYGPVREQAQ RSYAAVKFLL YSLFGGLLML AAVIGLYVVS 
ADNLGSGTFD FATLRQMDIT PGVQKLLFLG FFLAFAIKAP LFPFHTWLPD AGAQSPTGGA 
VLLVGVLDKV GTFGLIRYCI PLFPDAADYF APLVLGLAVI GIFYGALLAI GQRDMKRLVA 
YTSLAHFGFI ALGTFAFTSQ AGSGAVLYMV NHGLSTGLLF MVVGFLVARR GTRDVGAYGG 
LARVTPVLAG VFLVAGLSSL ALPGTNSFVS EFLVLVGTFT RNRPLAIVAT TGIVLAAIYI 
LYLYQRTMTG PVVHEENKVL VDLSLREKLV VAPMVALIVA LGVYPKPLLD IITPTVTATY 
ADIGKSDPAP THSVAAESGG HS