Gene Sare_4374 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Sare_4374
Symbol
ID	5705065
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Salinispora arenicola CNS-205
Kingdom	Bacteria
Replicon accession	NC_009953
Strand	-
Start bp	4940912
End bp	4942291
Gene Length	1380 bp
Protein Length	459 aa
Translation table	11
GC content	64%
IMG OID	641273796
Product	polymorphic outer membrane protein
Protein accession	YP_001539146
Protein GI	159039893
COG category
COG ID
TIGRFAM ID	[TIGR01376] Chlamydial polymorphic outer membrane protein repeat

Plasmid Coverage information

Num covering plasmid clones	18
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	3
Fosmid unclonability p-value	0.0000585185
Fosmid Hitchhiker	No
Fosmid clonability	decreased coverage

Sequence

Gene sequence

ATGAAGCATC AGCACCACAC TCACGAATCC AGAACGGATG GTCCCTGCGG GGGGCGGGCG 
AGGTCACGAT GGTGGGCGGT CGGATTGGCC GGGATGACCG GCTTGGCCCT CACCGCCACT 
GTCGCCGTCG CCACCCCTGT CGCTGACGCT GTCGGACGGG CCACCGTCGC CGACGACCGG 
CTTGGGAAGC CCGACCGGCC ACAGGGGGGT GATCACCGTG ACGAAGGTAA GGGGGAGGAC 
GCAAGCCACG TCAAGAAGCC AACGGGCACA CCTGTCCCCT GCAGCACGGG CCGGCTGATC 
GCCGCGATCA CCCTGGCCAA CGCCCGCGGC GGTGCCGTGC TCGACCTCGC CAAGAAGTGC 
ACCTACCTGC TCACCGCCGA CATCGACGGC GCCGGTCTAC CCGCGATCAC CACCCCCATC 
ACTCTCAACG GCGGCAAACA CACCACCATC AAACGCGCCG CGGCGGCCGA CGACTTCAGA 
ATCCTGACCG TGAACGCCAA CGGTCGACTC ACCCTCAATC ATCTCACCAT CACCGGCGGC 
AGGCTTTCCG GCGACAATGA CGGCGGCGGG ATTCTTATCA ATTCGGGTGG CGGTGCCACT 
GTCGACACCA GTAAAATCGT CGCAAACGTC TCGGTTGACG GCGATGCTGG TGCGATCATG 
AATAATGGCG GTGTGCTCGA CATCAGGCAT TCCATCATCA GTCGCAATAC GGCCGCCAAT 
ATCGGCGGCG CGATCTTCAG TATTGGTCAA CTCGTCGTCG ACAAGTCACG GTTCGATGCC 
AACGCTGCCC TGACTGGCGG TGCCATCACC ATCAGTGGCG ACGTCACCAT AACCCGGAGC 
GAGTTGGTCG ACCATCAGGC TGCCGACGGT GGCGCCGTCT TCTTCCTCGG CGGGTCGACC 
GGCAAGATCA CCGATACGCG TTTCGCGCGA AACACGGCGA CGAACACCGG CGGATCCGCC 
ATCGGCGGGG GCCCTACACA GCTCACCATG TCCCGGGTCA CCCTCGCCAA CAACACCACA 
ACCGGTGCCG GCGGGGGCGC ACTGTTTCTA CAAGGCGGAA GCGCGCTCGT GGAGGACAGT 
GTCATCAAGA ACAATGTCGG AACAAACGGC GGTGGCATTC GTAATCTTGG CGGGTTGACG 
CTGCTCCGCA CACAGGTCAC CGGCAACCAG GCCACCGAGT CGGGCGGCGG AATCCTCAAC 
GAGGCAAACG GCGTGCTCGC GCTGCTCAGC ACGAAGGTGG TCAAGAACGT CGCCGGCACC 
GACGGCGGCG GCATCTTCAA CGCGGTGGGT GGCACGGTCG ACCTGAACAC CGCCACCGGC 
ACCATCGTGG CCAAGAACCG ACCGAACAAC TGCACGAACG TTCCGGACTG CCCGGACTGA

Protein sequence

MKHQHHTHES RTDGPCGGRA RSRWWAVGLA GMTGLALTAT VAVATPVADA VGRATVADDR 
LGKPDRPQGG DHRDEGKGED ASHVKKPTGT PVPCSTGRLI AAITLANARG GAVLDLAKKC 
TYLLTADIDG AGLPAITTPI TLNGGKHTTI KRAAAADDFR ILTVNANGRL TLNHLTITGG 
RLSGDNDGGG ILINSGGGAT VDTSKIVANV SVDGDAGAIM NNGGVLDIRH SIISRNTAAN 
IGGAIFSIGQ LVVDKSRFDA NAALTGGAIT ISGDVTITRS ELVDHQAADG GAVFFLGGST 
GKITDTRFAR NTATNTGGSA IGGGPTQLTM SRVTLANNTT TGAGGGALFL QGGSALVEDS 
VIKNNVGTNG GGIRNLGGLT LLRTQVTGNQ ATESGGGILN EANGVLALLS TKVVKNVAGT 
DGGGIFNAVG GTVDLNTATG TIVAKNRPNN CTNVPDCPD