Gene Sare_4422 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Sare_4422
Symbol
ID	5703935
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Salinispora arenicola CNS-205
Kingdom	Bacteria
Replicon accession	NC_009953
Strand	-
Start bp	4996666
End bp	4997766
Gene Length	1101 bp
Protein Length	366 aa
Translation table	11
GC content	75%
IMG OID	641273841
Product	hypothetical protein
Protein accession	YP_001539190
Protein GI	159039937
COG category	[U] Intracellular trafficking, secretion, and vesicular transport
COG ID	[COG4963] Flp pilus assembly protein, ATPase CpaE
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	20
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	8
Fosmid unclonability p-value	0.0164716
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCCGCCCC GCCCCGCCGT AGTGCCCCCG CACCCCCTGC CCCTGCTCGT GACCTCCGAC 
GATGCTCTGC TGGACGACCT ACTGCGGCTC GCCGCGGCCG GAGGCGTCGA GGTCGACCTC 
GCCCCCGATC CGGTGTCGGC CCGTTCCCGC TGGTCACCCG CCCCACTGGT GCTGGTCGGC 
AGCGACCAGG CACAGCCGTG TCTGCGGGCG CGGCTGCCGC ATCGGCGGCG GTTGGTGCTG 
GTCGGCCGCT CCGGGCAGCT CGACCCCGGC AGGGATGTCG CCGACCTGAT GGGTGCCGAG 
TACGTCGCCG TCCTGCCCGC CGCCGAACCC TGGCTGGTGG ACCGGTTCGT CGAGTGCGGC 
CCGGATCGAG CCAACCCGGT AGCGGCCCGG GTCGTCGCCG TCCTCGGCGG ACGGGGTGGT 
GCCGGTGCGA GTGTGGTCGC TGGCGGGCTC GCCGTCACGG CGGCCCGGTC CCGGCTGCGG 
ACACTGCTGG TTGATGCCGA CCCGCTCGGC GGTGGGCTGG ACCTGGTGCT CGGCTGGGAA 
CAACAGGCCG GACTGCGCTG GCCTGCGCTG ACCGACGCCG ACGGACGGGT CGACGCGTCG 
TCGCTGGTGC GGGCCCTGCC GAGCCGGGGC GACCTGGTGG TCCTGTCCTG GGATCGTGGT 
GATCTCCGCT CGTTGCCCTC CCCGGCGATG GCCGCGACCC TCGACGCCGC CCGTCGCGCC 
TGTGACCTGG TCGTGGTCGA CCTGCCCCGA CACCTGGACG ACGCGGCGGT GACCGCCCTG 
CAGTCGGTCG ACCGGGCTTT CCTCGTGGTA CCCGCCGAAC TCAGGGCGGC GGCGGCTGCC 
GCTCGGGTAG TCCGCGCCGC CGCGCCACAC TGCGCCGACC TGTCCCTGAT CATTCGTGGG 
CCATCCCCGG GCCGGATCAG GGCCGCCGAG CTTGCGCGAA CGCTTGGGCT GCCGCTGGCC 
GGTACGGTGC GTCCGGAGCC GGCGCTCGGG CGCGGCCTGG AACGTGGTGA AGCGCCGGCC 
GCGGACGGGC GCGGCCCACT GGCCGCCCTG TGCCAGCGAC TCGTTGGCGA ACTCACCGGC 
ACCGCACCGG GCGCGGCATG A

Protein sequence

MPPRPAVVPP HPLPLLVTSD DALLDDLLRL AAAGGVEVDL APDPVSARSR WSPAPLVLVG 
SDQAQPCLRA RLPHRRRLVL VGRSGQLDPG RDVADLMGAE YVAVLPAAEP WLVDRFVECG 
PDRANPVAAR VVAVLGGRGG AGASVVAGGL AVTAARSRLR TLLVDADPLG GGLDLVLGWE 
QQAGLRWPAL TDADGRVDAS SLVRALPSRG DLVVLSWDRG DLRSLPSPAM AATLDAARRA 
CDLVVVDLPR HLDDAAVTAL QSVDRAFLVV PAELRAAAAA ARVVRAAAPH CADLSLIIRG 
PSPGRIRAAE LARTLGLPLA GTVRPEPALG RGLERGEAPA ADGRGPLAAL CQRLVGELTG 
TAPGAA