Gene Franean1_6798 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Franean1_6798
Symbol
ID	5675111
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Frankia sp. EAN1pec
Kingdom	Bacteria
Replicon accession	NC_009921
Strand	+
Start bp	8288606
End bp	8289751
Gene Length	1146 bp
Protein Length	381 aa
Translation table	11
GC content	72%
IMG OID	641245647
Product	hypothetical protein
Protein accession	YP_001511038
Protein GI	158318530
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	16
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	22
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACCAGTG AACGCTTAGT GGATTCGGCG CCGCCTCTGC CCGGCCCGCC GGTCGCCGGA 
CAGGGTTGGT GGGTGGCGGT CGCGGGGCAA CGGCCGCTGC CGGGACCCGG AGGACACCGA 
GGTAGTGGCG CGCGGCATGG ACGCGGAAGG CCCGGATCCC CGGGCGCGGA GGCTATACAC 
AGATCGTCGA CAGCCCGGTG GTGCGCTCGG GCCTCGCAAC TCCCGTCAGG TCCCATCAGG 
AAAGGCCGAC GAGCGTGTCT CAGCCCACTG TCGTCCTCGT CCACGGCGCC TTCGCCGACG 
CGTCCAGCTT CGCCAGGGTT GTTCCCGAAC TGCTCGCCGA CGGGGTCAGG GTGCTGGCAC 
CCGCCGTCGG CGAACCGCTC ACTCCTCGGC GACGCCGGGT ACATCGGGTC GGTGCTCGCG 
GCCGTCGACG GTCCCTTTGT GCTCGTCGGC CACTCGTATG GCTGCGCGGT GAGCCAGCAT 
GATCGAGTGA CGGATCGAGA TCGTCAGCTG TCGGTTCGCA CGGACCCGTG GACCACGGGC 
TCAACACTGG CTCCAGCCAT GCGACGCGGC CACACAACAC GTGGGCCGCA CCGTGGGGAC 
ATGTCAGCAT CACAGGCCCA ACGGATTCGT CCCGAGCGTC CGCGCCACGA CCCGCGTCCT 
GCCCACGGAC GAGGTCCGGT CATCGTCCGG TCCGACCCGC CCGCGAAGGT CGACGGGTCG 
CCGCAGCCGA CAGAGGCGGT CGCCGCACCG GCCACCCCCG TCGTCGGCTG GCGGCGGCTG 
TGGGCCGCGG CGCTGCTCGC AGGGTTCGTG ACCGTCGCGG CGATCCAGCC GCCCCGCGAG 
GCACGACCAC CGACACAACC GCCGTGGGTG GACGTCGTCA GCGCCGGCGC CCTCGTCCTC 
CTGGCAGCCG CGTTCGTCGC CCTGCTGGCC GACCACCGAT GGGGCTTCAC CCTCGCCGTG 
TACGGCAGCG CCGGCTTCCT CCTCGTCTCA GCTGTGTGCC CGGCGTGGAA CCACCACCAG 
GCGGGAACGT CGTGGATCGG TCAGACCGGA GTCGCCACAG CGATGCTCCT CGGCTCGCTG 
GTCGGGCGGG AGCGGACCGG CTCGGCCGGC CGAGCCGGTC CGCTCAGATC GGCAGGGATC 
CGGTGA

Protein sequence

MTSERLVDSA PPLPGPPVAG QGWWVAVAGQ RPLPGPGGHR GSGARHGRGR PGSPGAEAIH 
RSSTARWCAR ASQLPSGPIR KGRRACLSPL SSSSTAPSPT RPASPGLFPN CSPTGSGCWH 
PPSANRSLLG DAGYIGSVLA AVDGPFVLVG HSYGCAVSQH DRVTDRDRQL SVRTDPWTTG 
STLAPAMRRG HTTRGPHRGD MSASQAQRIR PERPRHDPRP AHGRGPVIVR SDPPAKVDGS 
PQPTEAVAAP ATPVVGWRRL WAAALLAGFV TVAAIQPPRE ARPPTQPPWV DVVSAGALVL 
LAAAFVALLA DHRWGFTLAV YGSAGFLLVS AVCPAWNHHQ AGTSWIGQTG VATAMLLGSL 
VGRERTGSAG RAGPLRSAGI R