Gene Francci3_0809 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Francci3_0809
Symbol
ID	3906436
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Frankia sp. CcI3
Kingdom	Bacteria
Replicon accession	NC_007777
Strand	-
Start bp	940356
End bp	941789
Gene Length	1434 bp
Protein Length	477 aa
Translation table	11
GC content	67%
IMG OID	637878142
Product	hypothetical protein
Protein accession	YP_479922
Protein GI	86739522
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	37
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	20
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGAACACG CACCATCACA CGAAAGGATC ATCAACCAGG GAGACGTCCC ACCCGCCGAG 
CAGTCGCACG ACGAGCGCCT GATCAACCGA GGCATCGAGG CCGCCGCCCA GGAGGAGCGG 
CCCATCGACG ACCGCACCGC GCGCTACATC GCCGGACAGC TGCACGGTGG TCAGGTCAGC 
GCCCTCTACA GCCTGGCCAG CACCGGCAAC ATTATCGAGG ACACCGTCTA CCACGAGCTG 
TACGAAGACC TCGAATCCCA GACGCCGGAA GTCGCCTCGT GGGTCGAAGC GCTGCGAACC 
TACTGCCAGG CCAGGCCCGA CAAGGGTCCG GTGAGCGGCT GGGCCGAGCA CGCCGCTCTC 
CTTGACCGCA TCGAGGCCAC GCGGGAGCGC ACGCGGATGC TCGGCGGGAT CGCCGTCGCC 
CCCGAACTGG CCGAAGCCGA CGAGACGTCC AGGAAAGATC ATTTCCTGCA TCCAGACCGA 
CTGAACGAAC TGTTCGGCGA ACCGCCGGAC GAGGAGATCG GCCGCGCCGA GGAGCTGGGC 
TGGTTCGGCC TGATCGTCGA CCACGGCACC GGCGGCGGCA CGATCATCTC CCAGGACGAG 
CAGGGCTTTC GGTACGTCTG GGAGACGGAG GACGGTGAAG CCCTCGACCA GCGGTGGCAG 
GCCATCCTCC GGGAGTACCG ACGCTACGAA GACGCTCTTG TCCAGCTCGA ACGACACGAG 
CAGGACGACC GGTGCGAACG GGTCGGCTAC GCCTGCCCGG AGTGCGAAGA GCAGATCATC 
GAACACTCGG TCGGACTTGA CGAGTCCACC TGGACGCACC AGGACGGCGG ACCGCTGTGC 
CCCGTCGTCG GAGACGGCGG CTACCAGCCG GCGCAACCAG GCCTCTGGCG GGACGGCGAG 
ATCGTGCCCC TGGCTGAGCA AGCTGACGGG GACGACGCCC ATGGTGACGG ACCCCGCGTC 
TACGTGGCCA GCCTCGCCGA CTACACCAAC GGCGAGCTAC ACGGCCGCTG GATCGCCGCC 
GACCATGATG TCGAAGACCT GGAGGGCGCC GTTGCCCGCA TCCTGGCGAC CTCACCAGCC 
CGGCGGCACG GCGAGGCGGC CGAGGAATGG GCCATCCACG ACTACGAGGG CTTCGATGAG 
GAGGTCACGT CCACGCTGGG CGAGGGCCGT CGCTACGACC GTTTGACCCC GCCACCGTTC 
AATCTTGGTG CAGGGTCCCG AAATCACTGT CCGCCCAGTC GCCAAGCGGC TCCTGACCAG 
GGACGATGCC CAGTGAGTCT CCGACCGACA ACATCATCCA CCGAGCCGAA CATGTGTTCC 
GTGGCTCTGG TGGGTCCGGA CACCGCGGTC CGTCTGGTGA CCGCGATCAT GGGCACGGTC 
GAGCTGGAAT CCGGATGGGG ACCGGTCGTC ACTCAGCCGC CGGTGATTTC CTGA

Protein sequence

MEHAPSHERI INQGDVPPAE QSHDERLINR GIEAAAQEER PIDDRTARYI AGQLHGGQVS 
ALYSLASTGN IIEDTVYHEL YEDLESQTPE VASWVEALRT YCQARPDKGP VSGWAEHAAL 
LDRIEATRER TRMLGGIAVA PELAEADETS RKDHFLHPDR LNELFGEPPD EEIGRAEELG 
WFGLIVDHGT GGGTIISQDE QGFRYVWETE DGEALDQRWQ AILREYRRYE DALVQLERHE 
QDDRCERVGY ACPECEEQII EHSVGLDEST WTHQDGGPLC PVVGDGGYQP AQPGLWRDGE 
IVPLAEQADG DDAHGDGPRV YVASLADYTN GELHGRWIAA DHDVEDLEGA VARILATSPA 
RRHGEAAEEW AIHDYEGFDE EVTSTLGEGR RYDRLTPPPF NLGAGSRNHC PPSRQAAPDQ 
GRCPVSLRPT TSSTEPNMCS VALVGPDTAV RLVTAIMGTV ELESGWGPVV TQPPVIS