Gene Francci3_3037 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Francci3_3037
Symbol
ID	3904390
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Frankia sp. CcI3
Kingdom	Bacteria
Replicon accession	NC_007777
Strand	-
Start bp	3603626
End bp	3604927
Gene Length	1302 bp
Protein Length	433 aa
Translation table	11
GC content	71%
IMG OID	637880357
Product	hypothetical protein
Protein accession	YP_482123
Protein GI	86741723
COG category	[S] Function unknown
COG ID	[COG3391] Uncharacterized conserved protein
TIGRFAM ID	[TIGR02276] 40-residue YVTN family beta-propeller repeat

Plasmid Coverage information

Num covering plasmid clones	21
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	12
Fosmid unclonability p-value	0.701373
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCCGGAGG GGTCGACAGC GCAGCGCCGC CAGCCGGGGA CCAGGTCCCG GCGGCGTGGT 
CTGATCATGT TGGCCGGGTT GGCGGCCCTG GTGGTCGCAC TGCTGGTGGT GTGGCTGATC 
CGGGTCAGGA GCGACCAGGC TACGGGGGCC GGTGCCGCCC GCCCGCCGGG TTCCGTTCCC 
GCGCCGGGCC GGGGAGCCGA CTCTGCCCTG CCCCGTGGCG ATGGCGGCGT CGTGGACGTG 
TACGCGCACG CGCGTGCCGG GATGCTGAGC CCGGTGGTCC GCGACGATCC GCCTCTCGTG 
TACGTCCCGA ACCTGCGCGA CGGCACCGTC ACGGTCATCG ACCAGCGCAC GCTGCGGGTC 
GTGGACACCT ACGCCGCCGG CCGCGAGCCT CAGCATGTGG TCCCCTCCTG GGACCTGCGG 
ACCCTGTGGG TGAACAACAA CCGCGGCAAC AGCCTGTCAC CGATCGATCC GCGGACCGGT 
CGGCCCGCCG GGCCCGCGGT ACCGGTCGCG GACCCGTACA ACCTGTACTT CACCCCCGAC 
GGGGCCAACG CGATGGTCAT CGCCGAGGCG AACCACCACA TCGACTTCCG TGATCCGCAC 
ACGTTCGCCC TACGGCACAG CCTGGACGTG GGCACGGCCT GCGCGGGCGT CAACCACGTC 
GACTTCTCCG TCGACGGCTC CTATGCGATC GCCACCTGCG AGTTCGCCGG ACGACTCGTC 
AAGATCGACA TCCCGCGTCA GCGGGTCATC GGATATCTGG ACCTCGGCCG GGACGCCGCT 
CCACAGGACA TCAAGATCGA TCCGGCCGGC CGGATCTGGT ACGTGGCGGA CATGAACGCC 
GACGGTGTCC ACCTCGTTGA CGGGGATCGC TTCACCAGGG TCGGTTTCGT CCGGACCGGG 
CCGGAGACCC ACGGCCTGTA CCCGAGCCGC GACGGCCGAT TCCTGTACGT CGCCAACCGG 
GGTGGCCACA TGGACTCCAT GAAACCGCCG TTCCCGCACT CCGGCGACCA GGGCTCGGTC 
TCGGTCATCT CCTTCGCCAC CCGGACCGTC GTGGCCACCT GGCCGATCCC CGGTGGGGGA 
ACCCCGGACA TGGGCAACGT CGATGCCAAC GGCTCGCGGC TGTGGCTGTC CGGCCGCCGC 
AGCAACGTCG TGTACGTGTT CGACACCGGC GGGCCCGGAG GTTCGGAGCC GAAGGCCGGC 
CGGCTGCTGG CTCGGATCCC CGTCGGCCGT GAGCCGCACG GTCTCGCGGT CTGGCCGCAA 
CCCGGTCGCT ACTCCCTCGG CCATACTGGG ATCATGCGCT GA

Protein sequence

MPEGSTAQRR QPGTRSRRRG LIMLAGLAAL VVALLVVWLI RVRSDQATGA GAARPPGSVP 
APGRGADSAL PRGDGGVVDV YAHARAGMLS PVVRDDPPLV YVPNLRDGTV TVIDQRTLRV 
VDTYAAGREP QHVVPSWDLR TLWVNNNRGN SLSPIDPRTG RPAGPAVPVA DPYNLYFTPD 
GANAMVIAEA NHHIDFRDPH TFALRHSLDV GTACAGVNHV DFSVDGSYAI ATCEFAGRLV 
KIDIPRQRVI GYLDLGRDAA PQDIKIDPAG RIWYVADMNA DGVHLVDGDR FTRVGFVRTG 
PETHGLYPSR DGRFLYVANR GGHMDSMKPP FPHSGDQGSV SVISFATRTV VATWPIPGGG 
TPDMGNVDAN GSRLWLSGRR SNVVYVFDTG GPGGSEPKAG RLLARIPVGR EPHGLAVWPQ 
PGRYSLGHTG IMR