Gene Strop_3801 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Strop_3801
Symbol
ID	5060279
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Salinispora tropica CNB-440
Kingdom	Bacteria
Replicon accession	NC_009380
Strand	+
Start bp	4356581
End bp	4357774
Gene Length	1194 bp
Protein Length	397 aa
Translation table	11
GC content	71%
IMG OID	640476059
Product	hypothetical protein
Protein accession	YP_001160610
Protein GI	145596313
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	43
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	20
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGACCAGA CGACCTTCGG TGCACGCCTA CGAGCCCACC GCGAACGTGC CGGGAAGACT 
CGACCGATCC TCGGCGGTCT GGTCGGTCGC AGCGCGGAGT GGGTCAAGGC ATTGGAGAAT 
GGACGCCTAC TTCCGCCCCG CCTTCCCATG ATGCTTCGCC TGGCTGAGGT GTTGGGGCTC 
ACCGACCTCG CCGACCTGAC CGGAGATCAG ACCCTGCCCG TGGCGTCGGT GACCCGCGCT 
GGTCATCCCG CTCTCGACAA GGTCGCCGCC GCGATACAAC GCTCTCCCCT GCCGGCCGGT 
CCGGCTACTC GGGTCGAGGT GCTGCGCGGC TTGGTCGGTC AGGCGTGGGA GTTGTGGCAC 
CGTTCAACCA CCGAACGGAC GGCGGTCGCC GGGGTACTTC CCGGGCTGCT GGCGGAGGCG 
CAGCGCAGCG CTCGCCGGCT GGACGGCCTG GCCCGCCGAC AGGCGCTCGT CGAACTGGCC 
CGGGTCTACC ACCTCACCCA GTTGTACCTG GCCCACCAGC CGTACCCAGA GTTGGTGTGG 
CTGGCCGCTG ACCGGGCGAT GTCTGCCGCG CAGGACGCCG ATGACCCGGC CGCGATCGCG 
GCGGCCGGCT GGTACTACGC CCACGTCTAC CGCGGAACCA ACCAGATCGA CGCGGCCGAG 
CAGGTGCTTG TCGACGCTGC CACTCTGGTG GACCCGGCAG CCGACGATGA GCAGTTGGCC 
CGGTGGGGGC AGGCCCAGCT CGGCCTCGCG CTGGGGCACA GCAAGGCTGG TCGAGCCGGG 
CAGGCATGGC GGGCATGGGA CGCCGCCGAC GAGGCCGCGG GCCGGCTTGG CAGCACGTAT 
ACCCACCCGT GGTTGATGTT CGGGCCGGCG GCCTGCGCGA CGTACGCGGT CACCATCGAA 
ACGGATCTGT GCCGGCCGGG CGCGGCGGTT CGGCGTGCGG GCACCATGGA CTACCGTGCG 
CTTCCGTCGT GTACGCGTCG GGCCGCCGCC CTGATCGAGG GCGCACGGGC GCATGTGCTG 
CATCGAGGTG AGTTGGCGGC GGTGCATCTG CTCGGACGGG CGCTGCGGGA AAGCGTGGAC 
ACCATGCGAC ACCACCCGTA CGCCCGCACC GCTGCCCTGG AGCTGTCCAG CCGGCCCGGC 
GTGGTCGGGG AGGACGCGAG GGAACTTGCC CTCGCGATCG GCGTAATGGG GTAG

Protein sequence

MDQTTFGARL RAHRERAGKT RPILGGLVGR SAEWVKALEN GRLLPPRLPM MLRLAEVLGL 
TDLADLTGDQ TLPVASVTRA GHPALDKVAA AIQRSPLPAG PATRVEVLRG LVGQAWELWH 
RSTTERTAVA GVLPGLLAEA QRSARRLDGL ARRQALVELA RVYHLTQLYL AHQPYPELVW 
LAADRAMSAA QDADDPAAIA AAGWYYAHVY RGTNQIDAAE QVLVDAATLV DPAADDEQLA 
RWGQAQLGLA LGHSKAGRAG QAWRAWDAAD EAAGRLGSTY THPWLMFGPA ACATYAVTIE 
TDLCRPGAAV RRAGTMDYRA LPSCTRRAAA LIEGARAHVL HRGELAAVHL LGRALRESVD 
TMRHHPYART AALELSSRPG VVGEDARELA LAIGVMG