Gene Francci3_1942 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Francci3_1942
Symbol
ID	3904304
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Frankia sp. CcI3
Kingdom	Bacteria
Replicon accession	NC_007777
Strand	+
Start bp	2281499
End bp	2283292
Gene Length	1794 bp
Protein Length	597 aa
Translation table	11
GC content	65%
IMG OID	637879279
Product	hydrogen:quinone oxidoreductase
Protein accession	YP_481046
Protein GI	86740646
COG category	[C] Energy production and conversion
COG ID	[COG0374] Ni,Fe-hydrogenase I large subunit
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	18
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	15
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACGACGA CCAGGCAGTC GAGAACCGGG GAGAAGCCCG CCCAGATCGT GGAGATGGCG 
TGGGACCCGA TCACGCGCAT CATCGGCAAC CTCGGGATCT ACACGAAGAT CGACTTTGCC 
AACCGGCGGG TCACCGAGTG TCACAGCACC TCGTCGCTGT TCCGCGGCTA TTCGGTGTTC 
ATGAAGGGCA AGGATCCGCG GGACGCGGGT TTCATCACCA GCCGCATCTG CGGCATCTGT 
GGGGACAACC ACACCACCTG CTCGGTCTAC GCCCAGAACA TGGCGTACGG CATCGCGAAC 
CCGCCGATGG CGGAATGGAT CATCAATCTC GGAGAGGCCG CCGAGTACCT GTTCGATCAC 
ACGATCTTCC AGGACAACCT GGTGTTCGTG GACTTCTGCG AGGCGATGGT CAAGCAGACC 
AATCCCGGCG TGCTGGCCCG GGCAGAGGCC ACCGCCGCAC CGAACGCGGC CGTGCACGGG 
ATGCGGACTA TCGCTGACAT CATGCGTTCG TTCAACCCGT TCGAGGGGGA GATCTACCGG 
GAGGCCCTCA AGGTTAGCCG GATCACCCGC GAGATGTTCT GCCTGATGGA GGGCAGGCAC 
GTGCACCCCT CCACGCTGTA TCCGGGCGGG GTCGGCACGA TGCCGGAACC GACGGTGTTC 
ACCGACTACC TCAGCCGGCT GATGGAGATC CTTGATTTCG TCAAGAAGGC CGTCGCGTTG 
AACGACGACC TGTTCGACTT CTGGTACGAG GCGCTGCCCG GTTACGAGGA GGTCGGCCGC 
CGCCGGGTGC TGCTGGGCTG CTGGGGCGCG TTCCAGGATC CGAACGTCGT GGACTACCGG 
TACGAGAACA TGACCACCTG GGGCCGGGCG ATGCACGTGA CACCCGGGAT CGTCGTCGAC 
GGCGATCTGC TGACCACCGA CCTGGTGGAG ATCAATCTGG GTATCCGGAT CCTGCTGGGC 
AGTTCCTTCT ACCAGGACTG GGTGAACGAG GAGCCGTTCG TCACCCGGGA TCCGCTCGGA 
AATCCGGTCG ACATGCGCCA TCCGTGGAAC CAGACGACGC TGCCGGTGCC GCAGAAGCGG 
GACTTCGGGG AGAAGTACAG CTGGGTGATG AGCCCGCGGT GGCTTGACGC CCGCAGCGGC 
GAGCATCTCG CCCTGGATAC CGGGGGAGGG CCCTTCGCTC GGCTTTACAC CACGGCACTC 
GCCGGACTGG TGAACACCCC CTACGTCACC GCGACCGGGG GCGCGGTGAA CATCTCGCTG 
CCGCGCAGCC GCACGCTGCC CGCCGTCGAC CTGCAGTGGA AGCCGCCGGC CTGGTCGAAC 
GCGATCGAGC GGGACCGGGC CCGTGTCTAC TTCGTCGCCT ACGCGGCGGC GATGGCGCTG 
TACTTCCTCG AGCAGGGCAT GGATCGGGTG CGCTCGGGTG ACACCCGGGT GTTCTGCGAC 
TTCGACGTGC CGGACGAGAC GATCGGCTGC GGTTTCCACG AGGCGGTGCG CGGCGTGCTG 
TCGCACCACA TGGTGGTGCG CGACGGCAAG ATCGCAAATT ATCACCCCTA CCCGCCGACG 
CCGTGGAACG GCAGCCCCCG CGACTTCTTC GGAACTCCGG GCCCCTACGA GGACGCGGTA 
CAGAACATGC CGATCTTCGA GGAGAACGGT CCGGAGGGGT TCAAGGGCGT TGATGTGATG 
CGGACGGTGC GCAGCTTCGA CCCCTGCCTG CCCTGCGGGG TGCACATGTA TCTCGGTCGG 
GGCCGCACCC TGCGCACGGT GCACTCGCCG ATGTTCGGGG CCAGCCATGG TTGA

Protein sequence

MTTTRQSRTG EKPAQIVEMA WDPITRIIGN LGIYTKIDFA NRRVTECHST SSLFRGYSVF 
MKGKDPRDAG FITSRICGIC GDNHTTCSVY AQNMAYGIAN PPMAEWIINL GEAAEYLFDH 
TIFQDNLVFV DFCEAMVKQT NPGVLARAEA TAAPNAAVHG MRTIADIMRS FNPFEGEIYR 
EALKVSRITR EMFCLMEGRH VHPSTLYPGG VGTMPEPTVF TDYLSRLMEI LDFVKKAVAL 
NDDLFDFWYE ALPGYEEVGR RRVLLGCWGA FQDPNVVDYR YENMTTWGRA MHVTPGIVVD 
GDLLTTDLVE INLGIRILLG SSFYQDWVNE EPFVTRDPLG NPVDMRHPWN QTTLPVPQKR 
DFGEKYSWVM SPRWLDARSG EHLALDTGGG PFARLYTTAL AGLVNTPYVT ATGGAVNISL 
PRSRTLPAVD LQWKPPAWSN AIERDRARVY FVAYAAAMAL YFLEQGMDRV RSGDTRVFCD 
FDVPDETIGC GFHEAVRGVL SHHMVVRDGK IANYHPYPPT PWNGSPRDFF GTPGPYEDAV 
QNMPIFEENG PEGFKGVDVM RTVRSFDPCL PCGVHMYLGR GRTLRTVHSP MFGASHG