Gene Francci3_1098 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Francci3_1098
Symbol
ID	3905769
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Frankia sp. CcI3
Kingdom	Bacteria
Replicon accession	NC_007777
Strand	-
Start bp	1309956
End bp	1311128
Gene Length	1173 bp
Protein Length	390 aa
Translation table	11
GC content	67%
IMG OID	637878431
Product	purine phosphorylases family protein 1
Protein accession	YP_480208
Protein GI	86739808
COG category	[F] Nucleotide transport and metabolism
COG ID	[COG0775] Nucleoside phosphorylase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	22
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	19
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGGAAAAA CACACCCGAT CGTCGTTTTG ACCGCCCTTG ACCTGGAGTA TCAGGCGGTT 
CGCGAACATC TGGCGGATGC ACGACTGCAC CGCCATCCGC AGGGAACCCG CTTCGAGGTA 
GGCCGGCTGG CCCGCGGCCG GTGCCGGGTG GCGCTTGCAC ATGTCGGCGT GGGAAACCAG 
TCGGCCGCGG TACTCGCTGA ACGAGCCATA GCCGAGTTCA CGCCGGCGGC GCTGCTCTTT 
GTCGGCGTCG CAGGCGCGCT TCATCGCCAT ATCGCACTGG GCGACGTCGT GGTGGCCACC 
CATGTGTACG CCTTCCACGG CGCCACCAAC GATGACGAAG GGCTCTGGGG GCGACCACGC 
ACCTGGCCGC TGTCGCACCG GGCCGACCAG ATCGCCCGCC ACCTCTATCG GACGAGGTCG 
TGGGCACGAC CGTCGGTCGA AGCCGAGTCT CTGCCACAGG TGCACTTCGG GCCGATCGCG 
GCAGGGGAGG TGGTGCTGAA CTCCACCGTG TCCGCTCTGG CCCGCTTGCT GCACGAACGT 
TACAACGACG CGCTCGCCAT CGAGATGGAG GGCGCGGGAG CCAGCCAGGC CGGGTTGCTG 
AACGACTCGC TGCCAGTGGT TGTAGTCCGC GGCATCAGTG ACCACGCCGA TGGCACCAAG 
GAATTGACCG ACCGCCAGCT GTGGCAGCAG CGCGCTGTGG CAAACGCCGC TGCGTTCGCC 
GCAGCGCTGG CCGAGGAACT GTCAACGGAC ATCGGACGGG TCGATGCCGC GGAACCCAGG 
ATCGGGAGGA CACCCATCAT GCAGACACCG CACCAGAACA TCCGCATCAT CGCTTCGGAA 
GGCGCGCAGG TCGGTGCGCA GACCGGAGTC GTGCACGGTG ACGTGCATAT CGGCGTCGCC 
GGTGAGCGCG CTCGGGTCGA CCTGCCGACA GCACTCCTCC GCTTCCGCGC TCGTCTGGAC 
GATGCACGCA CGGCCGGCGA TGTCGATGCT GAGACTTATG CCGCCGCCGA GGCTGAGCTC 
CGCGAGGCCG ACAAAGCACT CCAGGCGGAT TCACCCGCTA CTCGCGGCGC CCTGCTGATG 
GCGCTGAAGA AGGTCCGCGG ATTGGTCGGC GACGTCGCCG ACCTCGCCGC GAAGATCGGC 
ATGGTGATCA TGCTCGCTCA AGGCGTGTCG TGA

Protein sequence

MGKTHPIVVL TALDLEYQAV REHLADARLH RHPQGTRFEV GRLARGRCRV ALAHVGVGNQ 
SAAVLAERAI AEFTPAALLF VGVAGALHRH IALGDVVVAT HVYAFHGATN DDEGLWGRPR 
TWPLSHRADQ IARHLYRTRS WARPSVEAES LPQVHFGPIA AGEVVLNSTV SALARLLHER 
YNDALAIEME GAGASQAGLL NDSLPVVVVR GISDHADGTK ELTDRQLWQQ RAVANAAAFA 
AALAEELSTD IGRVDAAEPR IGRTPIMQTP HQNIRIIASE GAQVGAQTGV VHGDVHIGVA 
GERARVDLPT ALLRFRARLD DARTAGDVDA ETYAAAEAEL READKALQAD SPATRGALLM 
ALKKVRGLVG DVADLAAKIG MVIMLAQGVS