Gene Francci3_1077 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Francci3_1077
Symbol
ID	3906420
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Frankia sp. CcI3
Kingdom	Bacteria
Replicon accession	NC_007777
Strand	-
Start bp	1283031
End bp	1284002
Gene Length	972 bp
Protein Length	323 aa
Translation table	11
GC content	69%
IMG OID	637878411
Product	hydrogenase (NiFe) small subunit (hydA)
Protein accession	YP_480188
Protein GI	86739788
COG category	[C] Energy production and conversion
COG ID	[COG1740] Ni,Fe-hydrogenase I small subunit
TIGRFAM ID	[TIGR00391] hydrogenase (NiFe) small subunit (hydA)

Plasmid Coverage information

Num covering plasmid clones	15
Plasmid unclonability p-value	0.24331
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	17
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTCATCCG TGCTGTGGTT CCAGGGCGGG GCGTGCAGCG GCAACACGAT GTCCTTCCTG 
AACGCCGACG AGCCCAACGT CGTCGACCTA ATCACCGACT TCGGGCTGGA ACTGCTCTGG 
CACCCGTCGT TGGGGCTGGA GAACGGCGCC CAGGCCCGGG AGCTGTTCAC CGACTGCGCG 
CGGGGTGAGC GGCCGGTCGA CATCTTCGTC TTCGAGGGTT CGGTGATCCG CGGCCCGAAC 
GGAACCGGCG GCTTCGACGT CTTCGCCGAG CGGCCCATGC AGGACTGGGT GCGCGAGCTG 
GCCGCCCGGG CCCAGGTGGT GGTGGCGATC GGGGACTGCG CGTGCTGGGG CGGGATCCCC 
GCGACGGCGC CGAACCCGAC GGACTCCACC GGGCTGCAGT TCCACAAGCG TGAACGCGGC 
GGTTTCCTCG GCCCGGACTT CCGATCGCGC TCCGGGCTGC CCGTCGTCAA CATTCCGGGC 
TGCCCGGCCC ACCCGGACTG GATCACGCAG ATCATCGTGG CGCTGGCCAC CGGCCGGGCC 
GCCGACATCG CGCTCGACGA GCTGCACCGG CCACGGACGT TCTTCACGAC ATTCACCCAG 
ACCGGCTGCA CCAGGGCGGA GTACTTCGAA TACAAGCAGT CGACCCTGGC TTTCGGGGAC 
GGGACCCGCA AGGGCTGCCT GTTCTACGAG TTCGGCTGCC GCGGCCCGAT GACCCACTCC 
CCGTGCAACC GGATCCTGTG GAACCGCCAG TCGTCGAAGA CCCGCGCCGG CATGCCGTGC 
ATCGGGTGCA CGGAGCCGGA GTTCCCATTC TTCGACCTCG CCCCCGGCAC GATCTTCAGG 
ACCCGGAAGG TCGGCGGGCT CATTCCGCGG GAGGTGCCGG CGGGCAGCGG CCACCTCGGC 
TACCTGGCAC ACGCGGCAGC TGCCCGGATA GTCGCCCCGC AGTGGTCGAA GGAGGACATG 
TTCGTCGTCT AG

Protein sequence

MSSVLWFQGG ACSGNTMSFL NADEPNVVDL ITDFGLELLW HPSLGLENGA QARELFTDCA 
RGERPVDIFV FEGSVIRGPN GTGGFDVFAE RPMQDWVREL AARAQVVVAI GDCACWGGIP 
ATAPNPTDST GLQFHKRERG GFLGPDFRSR SGLPVVNIPG CPAHPDWITQ IIVALATGRA 
ADIALDELHR PRTFFTTFTQ TGCTRAEYFE YKQSTLAFGD GTRKGCLFYE FGCRGPMTHS 
PCNRILWNRQ SSKTRAGMPC IGCTEPEFPF FDLAPGTIFR TRKVGGLIPR EVPAGSGHLG 
YLAHAAAARI VAPQWSKEDM FVV