Gene Francci3_2587 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Francci3_2587
Symbol
ID	3906493
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Frankia sp. CcI3
Kingdom	Bacteria
Replicon accession	NC_007777
Strand	+
Start bp	3050754
End bp	3052286
Gene Length	1533 bp
Protein Length	510 aa
Translation table	11
GC content	77%
IMG OID	637879912
Product	respiratory-chain NADH dehydrogenase domain-containing protein
Protein accession	YP_481678
Protein GI	86741278
COG category	[C] Energy production and conversion
COG ID	[COG1894] NADH:ubiquinone oxidoreductase, NADH-binding (51 kD) subunit
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	19
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	10
Fosmid unclonability p-value	0.278958
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACCATCC GCGCTGCCAC CGGAGCGGCC CAACCGTCCA TCCCCACCGG CACCAGCATC 
GCCACCGGCA CCAGCGACGT CGGCCGCGCC GGCTCCCCTG AGGCCCAGCC CGGGTGGGGG 
CGCGAGCCCT GGCCCGCGGC CATGCACGCG GTACGGCCCG CGGCCGGCGC GGGCGGCCTC 
CCCGCGCATC ACGTCCCGGC CGGACGGCTG CTGACCGCAG CCGCGTCCGA CCTCGCCGCG 
CACGACCGAC AGTGTGGACC GCTGCCCTGG CGCGGCGGAC CCGGGCGGTT ACTTCCGGAG 
ATCCACGACT CCGGGCTGAC CGGGCGGGGC GGCGCGGCCT TCCCCACCTG GCGGAAACTC 
GCCGCGAGCG CCGAGGGCAC CTGCCTCGAC GGCAGCCACT CCGGCAGCGC GCACCGGGGC 
AGCACGCACC GGGGCAGCCA GCACCGGAAC GCCGGGCACC GAGCCGACCG GTACCGCAGC 
AGCGCGCACC CCGTGGTCGT CGCCAACGCC GCCGAAGGGG AACCCGAGAG CGCCAAGGAC 
GTCACCCTGC TCACCGTGGC GCCCCACCTC GTCCTCGACG GCCTGCAGCT CGCCGCGGAG 
GCGGTCGGGG CCGATGACGC CTTCGTCTAT CTCAAACCCG GTCCGGCGGT CACGGCGGTC 
CGGCGGGCGC TGGCCCAACG GCGGGCCGCG GGCTGGGACC GGTTCACCGT CCAGATCCGG 
GAGGCGCCGG AGACCTTCGT CGCCGGGGAG GCATCGGCCG TCATCGCAGC GCTGGAGGGA 
GGGGCGGCCC GGCCGCGCGC GCACTGGCAA CCGCTCGCCG AGGCCGGTTT CCACGGCCGT 
CCGACCCTGG TGCAGAACGC CGAGACACTC GCGCACCTCG CGTTGATCGC CCGGTGGGGA 
GCCAGCTGGT TCCGCTCGGT CGGGACCGCC GAGGAACCGG GCACGTTCCT GGCCACCGTG 
ACGGGAGCGG TCGCCGCGCC CGGTGTCGTC GAGGTGCCGT TCGGCACCCC GCTCGGCACT 
CTCGCGCAGC TCGCGGGCGG CTTCACCGAG CAGGTCGGGG CCTTCCGGGT CGGCGGTTAC 
AGCGGTGCGT GGCTGCCCGG CGGCCCGGGA GCGACGATCG CGATGTCCCG GGCGGCGCTG 
GCGCCGTGGG GTGCCGCACC GGGCACCGGA GTGGTCGCCG TCCTCCCGGC CCGGGGCTGT 
GGGCTCGTCG AGACCGCGCG CATCGTCGGG TACCTGGCCG CGCAGAACGC TGGCCAGTGC 
GGGCCATGCG TCAGCGGGCT GCCCCAGCTT GCGGACGCCG TGGCCGGGAT GGCCCGAACG 
GATGGCGGGT CCGGCGGCCC GGTGCAGGGG GCTGGCGATC CGGGACAGTC CGCCATCCGG 
GCGCTGCGCC TCGCCGCCCT GGTCGCCGGT CGCGGCGCGT GCCACCACCC GGACGGCGCG 
GCCCGCCTCG TGCACAGTGC GCTGCGCACG TTCGTCGACG ATATCCGGGC GCACGCCGAG 
GGCCGCTGCC TCGGCTCGGC GTGCGCATCC TGA

Protein sequence

MTIRAATGAA QPSIPTGTSI ATGTSDVGRA GSPEAQPGWG REPWPAAMHA VRPAAGAGGL 
PAHHVPAGRL LTAAASDLAA HDRQCGPLPW RGGPGRLLPE IHDSGLTGRG GAAFPTWRKL 
AASAEGTCLD GSHSGSAHRG STHRGSQHRN AGHRADRYRS SAHPVVVANA AEGEPESAKD 
VTLLTVAPHL VLDGLQLAAE AVGADDAFVY LKPGPAVTAV RRALAQRRAA GWDRFTVQIR 
EAPETFVAGE ASAVIAALEG GAARPRAHWQ PLAEAGFHGR PTLVQNAETL AHLALIARWG 
ASWFRSVGTA EEPGTFLATV TGAVAAPGVV EVPFGTPLGT LAQLAGGFTE QVGAFRVGGY 
SGAWLPGGPG ATIAMSRAAL APWGAAPGTG VVAVLPARGC GLVETARIVG YLAAQNAGQC 
GPCVSGLPQL ADAVAGMART DGGSGGPVQG AGDPGQSAIR ALRLAALVAG RGACHHPDGA 
ARLVHSALRT FVDDIRAHAE GRCLGSACAS