Gene Francci3_0741 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Francci3_0741
Symbol
ID	3905868
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Frankia sp. CcI3
Kingdom	Bacteria
Replicon accession	NC_007777
Strand	-
Start bp	857291
End bp	858619
Gene Length	1329 bp
Protein Length	442 aa
Translation table	11
GC content	74%
IMG OID	637878074
Product	F420-0--gamma-glutamyl ligase
Protein accession	YP_479854
Protein GI	86739454
COG category	[C] Energy production and conversion [S] Function unknown
COG ID	[COG0778] Nitroreductase [COG1478] Uncharacterized conserved protein
TIGRFAM ID	[TIGR01916] F420-0:gamma-glutamyl ligase [TIGR03553] F420 biosynthesis protein FbiB, C-terminal domain

Plasmid Coverage information

Num covering plasmid clones	23
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	13
Fosmid unclonability p-value	0.918099
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGTCTGAGC GCAGCGCGGA ACGGGCGCTG CGCGTGTTCC CGCTCACCGG CATCGGCGAG 
GTCCGTCCCG GCGACGATCT CGCCGTCCTG GTGGCCTCGG CCGTCCGGAC GCACGGCCCG 
ACACTCGCCG ACGGCGATGT CGTCGCGGTC ACCTCAAAGA TTGTTTCGAA GGCCGAGGGA 
CGGCTCGTCA CGGTGTCCGG CGACCGCGAG GAAGCCAGAC AGGCCATGAT CGACAGTGAA 
TCGGTACGCG AGGTCGCCCG GCGCGGCCCG ACCCGGATCG TCGAGACGCA CCACGGTTTC 
GTCCTCGCCA GCGCGGGGGT CGACGCGTCG AACATCGCCA AGGACTCCCT CGCCCTGCTC 
CCGGTGGATC CGGACGCCAG CGCCAGGCGG CTGCGGTCGG GCCTGGCCAC CGTGCTCGGC 
GTGGATGTCG CCGTCATCGT CACCGATACC GCCGGACGGC CGTGGCGGCG CGGCCTGACC 
GACATGGCCG TCGGGGTGGC CGGCATGGCG GCGCTGCGCA GCCACGTCGG CGACCTCGAC 
GGCTACGGCA ACGAGCTGGG GATGACCGAG GTGGCCGAGG CCGACGAGCT CGCCGCGGCC 
GCCGACCTCG TCAAGGGCAA GCTGGGCGCC ACACCGGTGG CAGTCGTCCG CGGCTACGGC 
CGGCTGCCCG ACGACGGCGC CGGCGGGCGG GCACTGCTGC GTCCCGCTGG TGAGGACATG 
TTCCGCCTCG GCACCCTCGA GGCGCGCCGG GCGGCGCTGC GCGACCGGCG CACCGTGCGG 
GACTTCTCCG ACGCCCCGGT CGACCCGGCC GCGGTCGACC GGGCGATCGC GGCCGCACTC 
ACCGCCCCGG CCCCGCACCA CACCACACCA TGGCGTTTCG TGATCGTGAC CGAGCGGCAC 
GCCGCGCTGC TCGACGCGAT GGCCGAAGCC TGGGCGGACG ATCTACGACG CGACGGGTTC 
GACGAGGCGG CCGTCGAGCG TCGGCTTCGG CGCGGCGAGG TGCTGCGGCG TGCCCCGCTG 
CTGATCGTTC CGATCATGGT CCTCGACGGC GCGCATCCCT ATCCGGACGC CCGCCGCGCC 
GCCGCCGAGG AGCGGATGTT CACCGTCTCC GTCGGGGCCG GGGTGCAGAA CCTGCTCGTC 
GCCCTGGCCA CGGAGGGTCT GGGGTCGTGC TGGGTGTCGT CGACGCTGTT CTGCCCGGAG 
GTGGTCACCC GGGTGCTCGA CCTGCCGGCC GATTGGACAC CGATGGGCGC GGTCGGGGTC 
GGGCACGCCG CCGCGCCCGC ACCCGCCCGA CCGGACCGCG ATACCGCGGC GTTCGTCCTC 
CACCGCTGA

Protein sequence

MSERSAERAL RVFPLTGIGE VRPGDDLAVL VASAVRTHGP TLADGDVVAV TSKIVSKAEG 
RLVTVSGDRE EARQAMIDSE SVREVARRGP TRIVETHHGF VLASAGVDAS NIAKDSLALL 
PVDPDASARR LRSGLATVLG VDVAVIVTDT AGRPWRRGLT DMAVGVAGMA ALRSHVGDLD 
GYGNELGMTE VAEADELAAA ADLVKGKLGA TPVAVVRGYG RLPDDGAGGR ALLRPAGEDM 
FRLGTLEARR AALRDRRTVR DFSDAPVDPA AVDRAIAAAL TAPAPHHTTP WRFVIVTERH 
AALLDAMAEA WADDLRRDGF DEAAVERRLR RGEVLRRAPL LIVPIMVLDG AHPYPDARRA 
AAEERMFTVS VGAGVQNLLV ALATEGLGSC WVSSTLFCPE VVTRVLDLPA DWTPMGAVGV 
GHAAAPAPAR PDRDTAAFVL HR