Gene Francci3_3872 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Francci3_3872
Symbol
ID	3906640
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Frankia sp. CcI3
Kingdom	Bacteria
Replicon accession	NC_007777
Strand	+
Start bp	4634762
End bp	4636243
Gene Length	1482 bp
Protein Length	493 aa
Translation table	11
GC content	73%
IMG OID	637881198
Product	hypothetical protein
Protein accession	YP_482951
Protein GI	86742551
COG category	[S] Function unknown
COG ID	[COG1322] Uncharacterized protein conserved in bacteria
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	19
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	16
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGGACACGA CCAGCGCGCT GCTGGCCCTG ATCGGGCTGG CTCTCGGCGC CATGGGCGGA 
TTCGCCGCCG CGCGCCGCTT CGCCGAGCCG CGGGTTGCCG CGCTCACGGC TGCGCACGCC 
ACCGCCGTGC GGGAGCGCGA CCAGGCCCGG GAGACCGCCG CCGCCGCTGC CGAGCGTGCG 
ATGCTGGCCG AGTCGGACGT GTCCAGCCTG CGCACCGCGC TGGAGTACGA GCAGCGAGCG 
GCGGGCGAGC GGGTGGCGCT GGTCGAGCAG AGCCAGGACC GGCTTGCCGA GAGCTTCCGA 
GCGCTGTCCG CGCAGGCTCT GGAGGGCGCG AGCCGTCAGC TGGTAGAGCT GGCCTCCGCC 
CGGCTGGACG AGGCCGGCGC CCGCGCCCGC GGCGACCTCG ACGCCCGTCG TTCGGCGGTC 
GAGAGCATGG TGACGCCGCT GCGGGAGGCT CTCGGGCGGA TGGAGGACCG GCTGCGGGAG 
CTGGAGACCG CGCGCACTGA GGCCTACGCG GCACTCGTCG AGCAGGTGCG GTTCGCCCGC 
GAGGCGTCGG AGAACCTCCG GTCGCAGACC GCCGCGCTCG TGACCGTGCT GCGCCGGCCC 
CAGGCCCGCG GTGCCTGGGG CGAGATGCAG CTGCGCCGGG TGGCGGAGGT GGCCGGCATG 
CTCAACCGCT GCGACTTCAC CGAGCAGATG ACGATCCAGG GCGACGACGG CCCGCAACGG 
CCCGACATGG TCGTCCACCT TGCCGGTGGC CGCAACGTGG TCGTCGACGC GAAGGTTCCG 
CTCAGCGCGT TCCTGGAGGC CGCCGACACG ACGGACGAGG AGCATCGCGC GCGCCGGATG 
GCCGCCCATG CCCGCCATCT GCGTGCGCAT GTCGACGGCC TCGGCGCCAA GTCCTACTGG 
CGGCGGCTGC CGTCATCCCC GGAGTTCGTG GTGCTCTTCG TCCCCGCCGA GGCGTTCCTG 
GCCCCTGCCC TCGATCACGA TCCCGGCCTG CTCGAACACG CCGCAGGCAA GAAGGTCATC 
ATCGCCACCC CAACCACGCT GATCGCTATG CTGCGGACCA TCGCCCACGC TTGGACTCAG 
GATGCGCTGA CCGCACGGAC GAAGGAGATC TTCGAGCTGG GTCGCGACCT CTACACCCGC 
CTCGGCACCC TGGGCGAACA CGTCGATCGC CTCGGTCGCT CGCTCGGCCG GGCGGTGGGG 
GACTTCAACG CCACCGTCGG CTCGTTGGAA AGCCGGGTGC TGACCCCCGC CCGCCGGCTC 
GCGGCCATGG AAGTCGTCGA GGCGGGGCTC CCCAGTCCGG TTCCGGTAGA GACCGGCGTG 
CGGCCGCTGT CCGCCGCCGA GCTCCTGAGG AGCACCGGGG AGGGCGCGAC GACCGGGCGG 
GGTGGCGCCA TGGAGGACCC CGGAATCGAT GTCGGGTACC AGACCCCTGA CGGCGCAGAT 
CCGGCCAGAT GGGACGCGAA CGACCAGCAT AAGGAGGATT AA

Protein sequence

MDTTSALLAL IGLALGAMGG FAAARRFAEP RVAALTAAHA TAVRERDQAR ETAAAAAERA 
MLAESDVSSL RTALEYEQRA AGERVALVEQ SQDRLAESFR ALSAQALEGA SRQLVELASA 
RLDEAGARAR GDLDARRSAV ESMVTPLREA LGRMEDRLRE LETARTEAYA ALVEQVRFAR 
EASENLRSQT AALVTVLRRP QARGAWGEMQ LRRVAEVAGM LNRCDFTEQM TIQGDDGPQR 
PDMVVHLAGG RNVVVDAKVP LSAFLEAADT TDEEHRARRM AAHARHLRAH VDGLGAKSYW 
RRLPSSPEFV VLFVPAEAFL APALDHDPGL LEHAAGKKVI IATPTTLIAM LRTIAHAWTQ 
DALTARTKEI FELGRDLYTR LGTLGEHVDR LGRSLGRAVG DFNATVGSLE SRVLTPARRL 
AAMEVVEAGL PSPVPVETGV RPLSAAELLR STGEGATTGR GGAMEDPGID VGYQTPDGAD 
PARWDANDQH KED