Gene Francci3_0545 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Francci3_0545
Symbol
ID	3904196
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Frankia sp. CcI3
Kingdom	Bacteria
Replicon accession	NC_007777
Strand	+
Start bp	633044
End bp	634393
Gene Length	1350 bp
Protein Length	449 aa
Translation table	11
GC content	68%
IMG OID	637877874
Product	NADH dehydrogenase subunit H
Protein accession	YP_479658
Protein GI	86739258
COG category	[C] Energy production and conversion
COG ID	[COG1005] NADH:ubiquinone oxidoreductase subunit 1 (chain H)
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	16
Plasmid unclonability p-value	0.629045
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	10
Fosmid unclonability p-value	0.321413
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAGCGCCA CCCCGTCCAC GCTCGTCTGG GCCGCGGCCG CGGATCCGGA CCTGCACGCG 
TTCGCCGACG ACCCGTTCTG GCTGATCCTG CTCAAGGCCG TGGCGGTGTT CGCCTTCCTG 
CTGCTGATGA CGCTGTTCGC GATCGTGTTC GAGCGCAAGG TCGTCGCGAA GATGCAGCAG 
CGGGTCGGCC CGAACCGCCA CGGCCCGAGG GGCTGGCTGC AGAGCCTCGC CGACGGCGCC 
AAGCTGATGC TCAAGGAAGA CCTCATCCCG GTACTCGCCG ACAAGCCGAT CTTCATCCTG 
GCGCCGATCG TCTCCGCGGT GCCGGCGTTC CTCGCCTTCG CGGTGATCCC CTTCGGCCCG 
GAGGTCTCGA TCTTCGGGGA GCGGACCACG CTGCAACTGG CGGACCTGCC GGTGAGCGTG 
CTCTACCTGC TGGCAGCCGC CTCCCTCGGC GTCTACGGGC TCATTCTGTC GGGCTGGTCG 
AGCGGGTCCA CCTACCCGCT GCTCGGCTCG CTGCGTTCGG CCGCGCAGAT CATCTCCTAC 
GAGGTCGCGA TGGGGCTCGC GTTCGTCGCG GTGTTCATCT ACGCCGGCAC GCTGTCGACC 
TCCGGCATCG TGGCGGGCCA GTCGGGTCGC TGGTACATCG TGCTGGTGCC GTCGTTCGTC 
CTGTACTGCA TCTCGATGGT CGGCGAGACG AACCGGACCC CCTTCGACCT CCCCGAGGCC 
GAGGGCGAAC TGGTCGGCGG GTTCCACACC GAGTACAGCT CCATCAAGTT CGCGTTCTTC 
TTCCTGGCCG AGTACATCAA CATGGTCACC GTCTCGGCGA TCGCGACGAC CTTGTTCCTC 
GGGGGCTGGC AGCCTCCGCC CATCCCCGGC CTGTCCGGTC TGAACTCCGG CTGGGTTCCG 
CTGATCTGGT TCGTCCTCAA GCTGCTGGCG TTCCTGTTCT TCTTCATCTG GCTGCGCGGG 
ACGCTGCCGC GGCTGCGGTA CGACCAGTTC ATGAGCTTCG GCTGGAAGGT GCTCATCCCG 
GTCGGTCTGG TCTGGGTGCT GGCCGTCGCG ACCTTCCGCG TCTACCAGAA GCACGTGGAC 
GACCGCACGC CCTGGCTCGT CGGGTTTGGC GTGGTCGTCG GCATCCTGCT GATCGTCGCG 
CTCATCGATC CCGGCGGCGC GAGGCACCAA CGGGAGCTGG AGGAGGCCGA GCAGCGCAAG 
CTGGCCGAGG CGCCGAGCCT CGACCGCATC CCGTGGCCCC CCCCACCGCA GGCCGCTGGA 
CGGGGTCGTC CGGCGGTGTC CGCCGGTGCC TCGGCCAATG GGTCGTCCAC TGTCATCCCC 
GCGGACCCCG GTCCGCGTCA GGAGCGTTGA

Protein sequence

MSATPSTLVW AAAADPDLHA FADDPFWLIL LKAVAVFAFL LLMTLFAIVF ERKVVAKMQQ 
RVGPNRHGPR GWLQSLADGA KLMLKEDLIP VLADKPIFIL APIVSAVPAF LAFAVIPFGP 
EVSIFGERTT LQLADLPVSV LYLLAAASLG VYGLILSGWS SGSTYPLLGS LRSAAQIISY 
EVAMGLAFVA VFIYAGTLST SGIVAGQSGR WYIVLVPSFV LYCISMVGET NRTPFDLPEA 
EGELVGGFHT EYSSIKFAFF FLAEYINMVT VSAIATTLFL GGWQPPPIPG LSGLNSGWVP 
LIWFVLKLLA FLFFFIWLRG TLPRLRYDQF MSFGWKVLIP VGLVWVLAVA TFRVYQKHVD 
DRTPWLVGFG VVVGILLIVA LIDPGGARHQ RELEEAEQRK LAEAPSLDRI PWPPPPQAAG 
RGRPAVSAGA SANGSSTVIP ADPGPRQER