Gene Francci3_0984 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Francci3_0984
Symbol
ID	3905840
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Frankia sp. CcI3
Kingdom	Bacteria
Replicon accession	NC_007777
Strand	+
Start bp	1161853
End bp	1163328
Gene Length	1476 bp
Protein Length	491 aa
Translation table	11
GC content	74%
IMG OID	637878318
Product	hypothetical protein
Protein accession	YP_480097
Protein GI	86739697
COG category	[S] Function unknown
COG ID	[COG5650] Predicted integral membrane protein
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	18
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	16
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCCCAGAA CCCGCGCCGC GCCACGCCTC AGGCCCGCCC TGGCCCTGGT CGGGGCGGGT 
GTCGGGCTCG CGGGTCTGCT CGCGACGCAG TGCGCCGTCC TTGCGGCGCC GGGATACCTG 
CCTGGCCGGG CAGGGGTGCT CTACCCCGTC ATGCTCTGGT GGGCGCTCGG TGTCGCCACG 
GCCGCGCTGC TGGTACACGC GGCCCCGCGC CGGTTGGCCG TCGCCATGCT GCTCGGCGGA 
ATCGTCGCCA TCCACGCCGT AGCGGCCACC ACCGGCCCGC AGCTCTCCGA CGACCTGTAC 
CGCTACGCCT GGGACGGTCG GGTCCAGGCC GCCGGGATCG ACCCCTACCG GTACGGCCCG 
CTCGCTCCGG AACTGGCCCG GCTGCGCGAT CGCTGGCTGT TCCCGGATCC GGCCGGATGC 
GCGGCGATCG GGCGCGGCCC GCACTGCATC CGGCTGAACT ACCCGCGCGC CCACACCATC 
TACCCGCCGG TGGCGCAGGC GTACTTCACC GCCGTTCATG TCCTGCCGGG GCCGCCACGC 
GAACACAAAC TCCAGCTCTA CGCCTCGCTG ATGTCCCTGG CGCTGGTCGG GCTGATGATG 
CGGATGCTGG TGGCGCGAGG CCGCGATCCG CGCCACGCGG CCTTCTATGC GTTCTCGCCG 
CTCGCCGGCC TGGAGATCGG TTCCGATGCG CACGTCGACG TCCTCGGGGC CGTGCTGGCG 
CTCAGCGCTC TGGCGGTCCT CACCGCCCGG TCCCGCCCGC TGCGGACGGG GGTCGCCGGG 
GCGCTGCTCG GCGGCGCGGT AGCGGTGAAG CTGTACCCGG CGTTGCTGCT GCCCGCGGCG 
GCCCGGCGCC GGCCCGTCAC GCTCGTCGGA GCCGCCGCCG GGGTGGTCGT GCTGTCCTAC 
CTGCCGCACA TCCTCGCCGT CGGCACACAG GCGCTGGGCT TCCTCCCGCA GTACCTCGAC 
GTCGAGGGCT ACGGGGAGGG CAGCCGCTTT CTCCTGCTCG CCGGGCTGCT GCACCTGGAC 
GGATCCGCAG CGAAGGCGGC AGCGGCCACC CTGCTGGCGG CGGTCACGGT CGCCGTGCTG 
CGGACCGATC CACAGCGGGT TCCCGTCGAA CGGGCCGCGC TGTGGCTGGT CGGTGCCGCG 
TTCCTTGTCG CGACCCCGGT CCAGCCCTGG TACGGGGTGC TGCTGGCGGC GCTCGCCGTC 
ATCGCCGGGC GGCTGGAATG GCTCGCCGTC GCCGCGGCCG CGCACCCCGT CTACGTCTCG 
CTGTTCACGG ATCTGCCCGG TGACGCGTGG ACTTTGCGGG TGTATTCCTA CGCCGTCGGT 
GGTGGCGTCG TGCTCGCCGC GACCGGTCTG CGCCGGTGGA CCGGCCGACG GCTGGCGGTC 
GACGAGCGCG CTGCCGCACC CGCGGCCCGA TCCGTCGTCG AACCCCGGCC CGAGTCGTCA 
CCGGGCGCAG GGACTGAAGG GCAGGTGAGG GTGTAA

Protein sequence

MPRTRAAPRL RPALALVGAG VGLAGLLATQ CAVLAAPGYL PGRAGVLYPV MLWWALGVAT 
AALLVHAAPR RLAVAMLLGG IVAIHAVAAT TGPQLSDDLY RYAWDGRVQA AGIDPYRYGP 
LAPELARLRD RWLFPDPAGC AAIGRGPHCI RLNYPRAHTI YPPVAQAYFT AVHVLPGPPR 
EHKLQLYASL MSLALVGLMM RMLVARGRDP RHAAFYAFSP LAGLEIGSDA HVDVLGAVLA 
LSALAVLTAR SRPLRTGVAG ALLGGAVAVK LYPALLLPAA ARRRPVTLVG AAAGVVVLSY 
LPHILAVGTQ ALGFLPQYLD VEGYGEGSRF LLLAGLLHLD GSAAKAAAAT LLAAVTVAVL 
RTDPQRVPVE RAALWLVGAA FLVATPVQPW YGVLLAALAV IAGRLEWLAV AAAAHPVYVS 
LFTDLPGDAW TLRVYSYAVG GGVVLAATGL RRWTGRRLAV DERAAAPAAR SVVEPRPESS 
PGAGTEGQVR V