Gene Franean1_1340 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Franean1_1340
Symbol
ID	5669751
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Frankia sp. EAN1pec
Kingdom	Bacteria
Replicon accession	NC_009921
Strand	+
Start bp	1612841
End bp	1614385
Gene Length	1545 bp
Protein Length	514 aa
Translation table	11
GC content	73%
IMG OID	641240271
Product	hypothetical protein
Protein accession	YP_001505698
Protein GI	158313190
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	16
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	17
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGATCCGCC CGCCGGTGTA CCGGCTTACC CGCCGCCGGT CCGGCGCGAC CCACTTCGGT 
CTCGCCGGGG CACCGCTGGT GCTGGTCGCA GGGGGTTTCG CCGCGCTGGT TCTGCTTCCG 
CTGCTGACCG ACAGCGTAGC GATCGGAGTC GTCGTGGCCG CTGCCTGCGG GCTGGCCGCG 
TTCCTGCCGG TACCGGGCGG AGGGCCCGTC TACCAGGCTG TACCGCTTGC CATGCGGCAT 
CTGGCCCGTC GGGTCGGAAG GCGGCACCAG TGGACCGCTT CGCTGCCCCT GCTCGCCGGC 
GCTCCTGCCA CGGCGGAGAG CACGAGGGGC GAGGCCCGAC GGCTCCTACC GCCGCCGCTA 
CGAGGTCTGG AGATCCTCAC CGTCCCCCGT GCTTCCGCGA CGGGCGCGAC GCGCAGCCTC 
GCTCCCATCG CCCTGATCCA TGACCGGCGC GCCGGCACGC TCACCGCGGT GCTGTCCGCA 
CGCGGCAGTG AGTTCGGGCT GCTCGAGCCT GCTGACCAGC ATCACCGGCT GTCCGCCTGG 
GCGCAGGTCC TCTCCAACAC TGCCCGCGAC AGCGGCGTGG TGCGGCTGGG CTGGTCGCTG 
TGGTCCGCTC CTGTCTCGCC GGCCGACCAT GTGCACTGGC TGAAGGACCG CCACCCTGAC 
ACGGCCACGG CGGGCGTCGG GCACACCCGG GCGGCTGAGG ACTACCAGAC GCTGCTCGAG 
AACGCCGCGG CGACGCTGAC CCGCCATGAC TTACGGCTGT GGCTGTCACT CGACACAGGC 
CGGCTGCCCC GCCGCGCCGA CCCGACTGAC GCCGCGGCGC AGGCCGCGCT CACCCTGGCC 
GAACGGTGCC GCGCCGCCGG CCTGGTCGTG GATGATCCCG ATTCGCCGGT GGGCGTCGCC 
GAGGCGCTGC GTCTGCGCGC CGACCCGTCC GTGGCCGCCA CCCTCTCCAG AGTGCAGCGC 
ACGCTCGCAC AGCAGATGGG CACCGCCAGC GTTATAGACG GCGTGCACGC CGGGCCGTTG 
TCGATGCACG CGCAATGGGA CGCCGTGCGC ATCGACGACG TATGGCACCG GGTCTTCTGG 
GTGTCACAGT GGCCGACGGC CGCCCTGCAC CCGGGCTGGC TCGACCCCCT GCTGTTCGAC 
GTCTCCTGCG TCCGCACGGT GGCGCTCCTG CTGGAGCCGG TGTCCGCACG TGCCTCCCGC 
CGGCGGATCA ACTCCGACGC CGTCGAGGTG GAGAGCCGGA TGGCGGTGCG GGAACGGCAC 
GGTTTTCGGG TTCCGACCCA CCTGGCAGGG GCGCAGCAGC AGGTCGACGA ACGGGAAGCC 
GAACTGCACG CCGGCCACGC CGAATACGGC TACCTCGCAC TCGTCGACAT CGCCGCGCCG 
ACCCGCGGCG ACCTCGACGA CGCCAGCCGC CAGCTCGTCG ACGTGGCCGC GTTCGCCGGC 
ATCAACGAAA TCCGCCCGCT ACACGGCCGC CACGACCTGG CCTGGGCCGC GACCCTACCC 
ACCGGCAGAG CACCCGGCCG CGGGCTTCTC GGTGGATCCC CATGA

Protein sequence

MIRPPVYRLT RRRSGATHFG LAGAPLVLVA GGFAALVLLP LLTDSVAIGV VVAAACGLAA 
FLPVPGGGPV YQAVPLAMRH LARRVGRRHQ WTASLPLLAG APATAESTRG EARRLLPPPL 
RGLEILTVPR ASATGATRSL APIALIHDRR AGTLTAVLSA RGSEFGLLEP ADQHHRLSAW 
AQVLSNTARD SGVVRLGWSL WSAPVSPADH VHWLKDRHPD TATAGVGHTR AAEDYQTLLE 
NAAATLTRHD LRLWLSLDTG RLPRRADPTD AAAQAALTLA ERCRAAGLVV DDPDSPVGVA 
EALRLRADPS VAATLSRVQR TLAQQMGTAS VIDGVHAGPL SMHAQWDAVR IDDVWHRVFW 
VSQWPTAALH PGWLDPLLFD VSCVRTVALL LEPVSARASR RRINSDAVEV ESRMAVRERH 
GFRVPTHLAG AQQQVDEREA ELHAGHAEYG YLALVDIAAP TRGDLDDASR QLVDVAAFAG 
INEIRPLHGR HDLAWAATLP TGRAPGRGLL GGSP