Gene Plav_2047 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Plav_2047
Symbol
ID	5454921
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Parvibaculum lavamentivorans DS-1
Kingdom	Bacteria
Replicon accession	NC_009719
Strand	+
Start bp	2232411
End bp	2233607
Gene Length	1197 bp
Protein Length	398 aa
Translation table	11
GC content	54%
IMG OID	640877624
Product	hypothetical protein
Protein accession	YP_001413318
Protein GI	154252494
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	37
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	31
Fosmid unclonability p-value	0.000225878
Fosmid Hitchhiker	Yes
Fosmid clonability	hitchhiker

Sequence

Gene sequence

ATGTCTGATG GTCCACACTT CTCTAAAGTG TGCGCTGGCG GAGAGCCCCG GCTCGATGTG 
CTGTTTGTTC ACGGCCTCAC TGGCGACCCT CGCGAAACCT GGACTTCCGG AGGACCTGAA 
CAGGAATACT GGCCCAAATG GCTGTGCGAA GAGCTAGAGG GGGTGTCGGT ATACGCTCTG 
GGATACCCTT CTAGCATCTT CGGAAAATGG GCCAAGAAGG AGATGAATCT CCACGAGCGG 
GCAGGCAATA TGCTAGAGCA TCTTGCCGCC AACGGTATCG GAGCTAGACC GATTGCCTTA 
GTCGGCCACA GTCTTGGCGG CATCCTTGTC AAAGAAATGC TCCGCGCATC CAACGAATGT 
GCTGACAGGG ATTGGCAAGC GATTGCTGCG CAAACCCGTC TCGCCGTCTT CATGGCAACG 
CCGCACAAGG GAGCCTCACT GGCTTCGGCG GTAAAGCTTA TTGTACCGCG GCTTTCTTCC 
ACGCATGTGG ACCTTTTAAG CAACGATAGT GGCTATCTGA CTAGTCTCAA CCAAGCCTAT 
CGCGACTTCG CGAACGGTGC GGGTATCGCA ACCGTGGCCT ACTATGAAAA ATATAAGACC 
AAAGGCTCTA GCGTGATCGT TCCAGAAGAC AGCGCTGACC CGGGGGTCGG AGCCACGAGG 
CCGGTGGCGG TCGATGCTGA TCACATCTCA ATTTGCAAAC CGGCAAAACG GACCGATCTC 
ATTTACGTTT CATTGTGCCG TCACTTGAAG GCTGTTCTGC AGCAGTGTTC CATGTCGGCG 
GGTGAAGACG GCGCTCTCGA TTCATTCGCC TCGGACGATT ATGGCACAAG TTCCGAATCG 
GATCGTCGAG ACCTGCTGCA AAAGCTGATC GATGCGGGGC GAGAACACGA ATATCAGAAA 
GCCAACAGCC TCCAGAATAA ATTCGCGCAG CGTTATTACA AGCTGGGCTT ACATACCGAC 
GCCAAAACTA AAAGCGATGC GGTGCTGGCC GCAGTCGAGC AACGTTTTTT TACGCACGTC 
TACGGCGGAA AAATCTGCAA GGGCGCGACC GACGAAGAAA TTGCGGCTGC TCTGCAAGTG 
CATGTCATTG ATCCATTGTG CAGCGGTACA GGAAAGGATC ATTTGAGCCC GACCGCGATT 
TTGCAGGCGC TCTACTTTCT CACTGAGCAA TGTTACATTC AGTGGGACGC AGCATGA

Protein sequence

MSDGPHFSKV CAGGEPRLDV LFVHGLTGDP RETWTSGGPE QEYWPKWLCE ELEGVSVYAL 
GYPSSIFGKW AKKEMNLHER AGNMLEHLAA NGIGARPIAL VGHSLGGILV KEMLRASNEC 
ADRDWQAIAA QTRLAVFMAT PHKGASLASA VKLIVPRLSS THVDLLSNDS GYLTSLNQAY 
RDFANGAGIA TVAYYEKYKT KGSSVIVPED SADPGVGATR PVAVDADHIS ICKPAKRTDL 
IYVSLCRHLK AVLQQCSMSA GEDGALDSFA SDDYGTSSES DRRDLLQKLI DAGREHEYQK 
ANSLQNKFAQ RYYKLGLHTD AKTKSDAVLA AVEQRFFTHV YGGKICKGAT DEEIAAALQV 
HVIDPLCSGT GKDHLSPTAI LQALYFLTEQ CYIQWDAA