Gene Francci3_1941 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Francci3_1941
Symbol
ID	3904303
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Frankia sp. CcI3
Kingdom	Bacteria
Replicon accession	NC_007777
Strand	+
Start bp	2280341
End bp	2281405
Gene Length	1065 bp
Protein Length	354 aa
Translation table	11
GC content	67%
IMG OID	637879278
Product	NADH ubiquinone oxidoreductase, 20 kDa subunit
Protein accession	YP_481045
Protein GI	86740645
COG category	[C] Energy production and conversion
COG ID	[COG1740] Ni,Fe-hydrogenase I small subunit
TIGRFAM ID	[TIGR00391] hydrogenase (NiFe) small subunit (hydA)

Plasmid Coverage information

Num covering plasmid clones	24
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	16
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACGGCCA CGAACCCGCA GTCCGGGAGC TCGCGACGCG GCGGTTTCGA CGAGGTGCAC 
ATCCTCTGGA TCTCCGAGGG GATGAGCTGC GACGGCGACA CGGTGTCGGT GACCGCGGCC 
TCCCAGCCAG CGATCGAGGA TGTCGTCACC GGGCTCGTGC CGGGGTTGCC GACGGTCCAT 
CTGCATAACA AGGTGCTGTC GCCGACCGTC GGCGGGGAGG AGTTCCTGGC CCCGTACCGA 
GCCGCGGCCC GCGGTGACAT CGAGCCGTTC ATCCTCGTCA TCGAGGGCTC GATTCCGAAC 
GAGAACATCC ACGGCGACGG GTACTGGACG TCGTTCGGGA ACGATCCGGA CACCGGCCAG 
CCGCTGACCC TGAACTGGTG GATCGACCGG CTGGCACCCA GGGCGTGGGC GGTCGTCGCG 
ATCGGCACCT GCGCCGCGTA CGGCGGGATC CACGCGATGG CCGGCAACCC GACCGGGTCG 
ATGGGCCTTG CCGACTACCT GGGCCATGAC TTCACCTCCG CCGGCAACCT GCCGATTGTC 
AACGTCCCCG GCTGCCCGGT TCAACCGGAC GACTTCATGG AGACGCTGAC CTGGGTGCTT 
TACCACGCGG CGGGCACGGC ACCGCCGCCA CCGCTGGACG ACCAACTCCG ACCCCAGTGG 
ATCTTCGGTC GGACCGTGCA CGAGGGCTGT GACCGGGCGG GCTACTACGA ACAGGCCGAT 
TTCGCGAAGG ACTACAACTC GCCGAAGTGT CAGGTGAAGA TTGGCTGCTG GGGTCCGGTG 
GTGAACTGCA ACGTGCCCAA GCGCGGGTGG ATGGGCGGGC TGGGCGGCTG CCCGAACGTG 
GGCGGCATCT GCATTGCCTG CACGATGCCG GGATTCCCGG ACAAGTTCAT GCCGTTCATG 
GACATGCCGC CGGGAGGGAG CCTGTCCTCG CGCGCGATCA AACCCTACGG GTCGTTCATC 
CGCAGGCTGC GTGGCATCAC CAATGCGACG GCGAACACCG AGCCGAAGTG GCGGCACAAC 
CGGGAGCTGC TGACCACCGG CTACGACCCG CATTACCGCC CCTAG

Protein sequence

MTATNPQSGS SRRGGFDEVH ILWISEGMSC DGDTVSVTAA SQPAIEDVVT GLVPGLPTVH 
LHNKVLSPTV GGEEFLAPYR AAARGDIEPF ILVIEGSIPN ENIHGDGYWT SFGNDPDTGQ 
PLTLNWWIDR LAPRAWAVVA IGTCAAYGGI HAMAGNPTGS MGLADYLGHD FTSAGNLPIV 
NVPGCPVQPD DFMETLTWVL YHAAGTAPPP PLDDQLRPQW IFGRTVHEGC DRAGYYEQAD 
FAKDYNSPKC QVKIGCWGPV VNCNVPKRGW MGGLGGCPNV GGICIACTMP GFPDKFMPFM 
DMPPGGSLSS RAIKPYGSFI RRLRGITNAT ANTEPKWRHN RELLTTGYDP HYRP