Gene Francci3_0638 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Francci3_0638
Symbol
ID	3903316
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Frankia sp. CcI3
Kingdom	Bacteria
Replicon accession	NC_007777
Strand	+
Start bp	722278
End bp	723495
Gene Length	1218 bp
Protein Length	405 aa
Translation table	11
GC content	74%
IMG OID	637877971
Product	hypothetical protein
Protein accession	YP_479751
Protein GI	86739351
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	16
Plasmid unclonability p-value	0.594729
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	14
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCGCCTCG ACGAGCACGG CCGTTGGGTC AGCGACGACG GTGCCTACGT CTGGGACGAG 
GCTGCCCAGA CCTGGCAGCC GTCATCGGCA GCGCCGCCGG CTGGTTCGTC GGCCTCGGCG 
CGATTCGGCA ACCATCCCGG TGGGCCCGCC TTCGGTGCCG GTCCGGCCGG GGAGCCCGGG 
TCCGGTCGGG TCGGGTCCGA GGTAGGAGCG CAGGGCGGTT CGTTTGGTGG GCGGCCCGGT 
GCTGCCGGCT CGTCGCCCGG TGCCGGACCC GGTGCCGGAC CCGGTGCCGT GGAAGCGGCT 
CCGGCACCGC CGAGTTGGGG CGGGGCGCTC ACCGATCCAC CCCGCACCAT GGGCGGGGTG 
GTGGCCACGC CGTCAGAGCC GGACGCGCGG GGGCTGGCAC CCTACGGCCC CACCGGCCAG 
CGCGGCCGGT GGGGGGAACC GGCCGCGGAC GTCATTGCAC CGCACGGGCC GTCGGAGCGG 
GGCGATCTGA CCGGTCCGGC CCGCCGCGCG GGTGCGGCGG ATCCCGTCGA TCCGGTGGCT 
GCGTCCGCCG GGCCGGCCGC GGCGCAGACG ACCTGGGGCG ACGGCGACTC GACCGGCGAG 
ATCCGGCGTG TCGGGGGCTT AGCGGCGACG TACGCCCCGT CCGCCGGCGG TGCGGCGGAC 
GGCACATCGC GGTGGGACGA CGATCCGGAC GACGAGCCGG GGCCGTACGC CGGGTCGTTC 
GACGAGCACG ACAGTGGATG GGCACCGTCC GGGCCCATCT CCCGGCGCGG GGCGACGGCT 
CGGCGTGAAT CGACGGCTCG GCGCGGGGCG ACGGCCCGGC GCGACGAGGC CGGCGGGCTG 
CCGGCACGGG TCACCGCGTT CGTCCAGCAC GTGCGCGACC GTCCGCCGTT GCTGATCGGC 
GCCGCCGTCG TTCTCGTCTG CCTCGGGCTC GGCGTCATCG GATTCCTCGC CCTCGGCGGC 
GGTGGATCGG ACTCCGGGAC CGCGGCCGGC CCGGCCGCGG CGGAGAAGGG CCGTTACTCC 
CCGGAGGTCC GTCAGGCATA TCTCAGCTCG TGCCTCGACG TCAGCAACGG TAACGAAGGC 
TATTGCACCT GCACGCTGGA GAAGTTGGAA GCCGGCTACA CCCAGGAGGA GTACCAGCGG 
TTCAGTGACA ACGTCCAGTC CGAGTCGTCG CAGCGCATCG TGCGGGAGAT CTATGCCGCC 
TGCCGTGACA AGCGATGA

Protein sequence

MRLDEHGRWV SDDGAYVWDE AAQTWQPSSA APPAGSSASA RFGNHPGGPA FGAGPAGEPG 
SGRVGSEVGA QGGSFGGRPG AAGSSPGAGP GAGPGAVEAA PAPPSWGGAL TDPPRTMGGV 
VATPSEPDAR GLAPYGPTGQ RGRWGEPAAD VIAPHGPSER GDLTGPARRA GAADPVDPVA 
ASAGPAAAQT TWGDGDSTGE IRRVGGLAAT YAPSAGGAAD GTSRWDDDPD DEPGPYAGSF 
DEHDSGWAPS GPISRRGATA RRESTARRGA TARRDEAGGL PARVTAFVQH VRDRPPLLIG 
AAVVLVCLGL GVIGFLALGG GGSDSGTAAG PAAAEKGRYS PEVRQAYLSS CLDVSNGNEG 
YCTCTLEKLE AGYTQEEYQR FSDNVQSESS QRIVREIYAA CRDKR