Gene Francci3_3163 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Francci3_3163
Symbol
ID	3903885
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Frankia sp. CcI3
Kingdom	Bacteria
Replicon accession	NC_007777
Strand	-
Start bp	3741845
End bp	3743194
Gene Length	1350 bp
Protein Length	449 aa
Translation table	11
GC content	73%
IMG OID	637880484
Product	HAD family hydrolase
Protein accession	YP_482249
Protein GI	86741849
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG0647] Predicted sugar phosphatases of the HAD superfamily
TIGRFAM ID	[TIGR01460] Haloacid Dehalogenase Superfamily Class (subfamily) IIA

Plasmid Coverage information

Num covering plasmid clones	9
Plasmid unclonability p-value	0.0117236
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	10
Fosmid unclonability p-value	0.303399
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACCCGGC CGGCCGCCGT GCCCGCGCCG GCGCACGAGA CCACGTCAAC CAGCCCTTCG 
TCAGTCAGCC CTTCCGCGGT CTCCTCCGCT TCGTCGTCCT GCGGCTTGTC CGGTTCCTCT 
GTGTCCTCTG TGTCCTCTGG TTTCTCCGTG TCTTCCGGCG GCTTCCCCGG GCCGTTGCGC 
GGGACGGACC GGCCGCTGGC CGACCTGTTC GACGTCGCCC TGATGGATCT CGACGGTGTC 
GTCAACCGTG GGGCCGCCGC CGTGCCACAC GCGGCCGGCA CCATCGCAGC CGCGGGCCGC 
CGGGGGATGC GCACGGTGTA CGTCACGAAC AACGCACTGC GCCCGCCGGC CGAGGTCGCC 
GCCCGCCTGC GCGGCTTCGG CGTGCCGGCG CAAACCGAGG ACGTCGTCAC CTCGGCGCAG 
GCAGCGGCGC ACGTCCTGGC CGAACGGCTG GGCACCGGAT CCCGGGTGCT CATTACCGGA 
GGGCGGGGAC TTCGACAGGC GGTGATGGAG GAGGGCCTGG TCCCGGTGGA CTCGGCCGAG 
GACGATCCGG CGGCGGTGGT CCAGGGGTTC GACCCGGATC TCACCTATGC CCGCCTCGCC 
GAGGCGGCCT ATGCCATCCG GGCCGGAGCA CTGTGGATCG CCAGCAACGC CGATCGCACC 
GTGCCAACCG AGCGGGGCGT CGCGCCTGGT AACGGATCCG TCATCGCCTT CCTGCGGGCC 
GCTACGGACC GCGAGCCGGT GGTGACCGGC AAGCCCGAGT CGGCGATGCA CCGCGAGTCG 
ATGCGGCGCA GCGGAGCCCG GATACCCCTC ATCGTCGGTG ACCGGCTCGA CACCGACATC 
GAGGCCGGTC ACCGGACGTC GACGCCGACC CTGCTCGTCT TCACCGGGGT GACGACCCCC 
GGAGACCTGC TCGCAGCTCC CGCTCCGCAC CGTCCCGACT TCCTCGCCGC GGACCTGCGC 
GGGCTGCTCC GGGCGGCGCC ACCGGTGGAG GCCGTCCCGG AGCTGGGGAA CCACGCCTAT 
CGTTGCGGCG CCTGGAGCAG CCGGGTCGAG GAGGGGACGC TGCACTGGTC GGGTGAAAGC 
TACGGGCTGG GCGATGACGC GTCGGATGGC GATCGTTCAG GCGGCGGTCA TTCCGGTGGG 
GATGCGTCAG ACCGGGATAT GTCGGGTGAC GACACGTGGA ACGGGGACGG CACCGACGGG 
CTGGACGGGC TGCGGGCCGC CTGCGCCACG GTCTGGTCCG CCCTGGACAG CGGCGTCGCC 
GTCCACGCGA TCGCGGCGCG ACGCCCACCG GGTTGCGAGG ACCTGATGGC TCCGGCGCCC 
CGGGCACCGG AGCCCGTGGC GCTCGCCTGA

Protein sequence

MTRPAAVPAP AHETTSTSPS SVSPSAVSSA SSSCGLSGSS VSSVSSGFSV SSGGFPGPLR 
GTDRPLADLF DVALMDLDGV VNRGAAAVPH AAGTIAAAGR RGMRTVYVTN NALRPPAEVA 
ARLRGFGVPA QTEDVVTSAQ AAAHVLAERL GTGSRVLITG GRGLRQAVME EGLVPVDSAE 
DDPAAVVQGF DPDLTYARLA EAAYAIRAGA LWIASNADRT VPTERGVAPG NGSVIAFLRA 
ATDREPVVTG KPESAMHRES MRRSGARIPL IVGDRLDTDI EAGHRTSTPT LLVFTGVTTP 
GDLLAAPAPH RPDFLAADLR GLLRAAPPVE AVPELGNHAY RCGAWSSRVE EGTLHWSGES 
YGLGDDASDG DRSGGGHSGG DASDRDMSGD DTWNGDGTDG LDGLRAACAT VWSALDSGVA 
VHAIAARRPP GCEDLMAPAP RAPEPVALA