Gene Plav_1231 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Plav_1231
Symbol
ID	5454612
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Parvibaculum lavamentivorans DS-1
Kingdom	Bacteria
Replicon accession	NC_009719
Strand	-
Start bp	1366218
End bp	1367309
Gene Length	1092 bp
Protein Length	363 aa
Translation table	11
GC content	62%
IMG OID	640876801
Product	pentapeptide repeat-containing protein
Protein accession	YP_001412508
Protein GI	154251684
COG category	[S] Function unknown
COG ID	[COG1357] Uncharacterized low-complexity proteins
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	25
Plasmid unclonability p-value	0.388459
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	61
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTCCGAGC GTTTCAAAGC TGCCGCCAAG ACGAACGGCG AGGGTTCTGC CGCGTCCGCC 
CGCAAGGGTG GTGCCGATGA TCATGCGATC GTCGGACGCC GTATCAGCCA GGAAGCGCTG 
AAGCGTCTGA GCGAGCTCCA CACGCGCTAT CTCAAGGGCA TCCCGAACGG CTGGTGCGCG 
GTGATGAAGG AGTGCGATCT GTCGGGTCTC GATTTTCGCA ACCTCAACTT CTCGCATGGT 
CATTTCATCG GCTGCGACTT CACAGGCTGC GACCTTGAAG ACGCGCATTT TTCGGGCGCC 
AATCTTTTCA GCGCAAATTT CGACCATGCG AATCTCACAC GCACCAATTT CTCGCGCGCG 
GATTTGCGGG GCGCGAATTT CGAAGATGCC GAAATGGCGG ATGCACAGCT CGATGGTGCC 
GACCTGCGGC GTGGCGCGGT GATAAGGCGC GGCGCCTCGG CACCTGTTGG CCGCGAGAAT 
TCGAGCTTTC GCGGTGCACG GATGTACGGC ACCAACATGG CCGAATGCAA ACTTCTCGAC 
GCCGATTTCG AAGGGGCCTC TATCTCCGGC GCTAGCCTGC AAGGTGCCGA TCTGCGGGGT 
GCGAACTTTG CGGGTGCCGA GCTCAAGGGC GTCGAATTGT CGGGGGCTAA TCTCGCCGAT 
GCGGATTTCC GCCGCGCCGT CATGGACGAG GCGACAATCG CGCGCGGCGA CATGATGCGG 
GCGACCAGGC CGAGGCCGGC GCCCAATCCC GAACGCATGG AAAAAATACT GGCGCTTCAT 
CTCGAGTGGA TCCAGACCGG CCAGCAAAAA GGCCAGCGCG CCGATTTCAC CCGGATGGAT 
CTCTCGCGAA AGGATTTCTC CAGGGCCGTG CTTGCCGGGG CCCATTTCCG TGAGGCCATC 
CTCGCCGATG CAAATTTCGA AAAGGCGATC CTTGCCGCCG CCGATTTCAG CAATGCGATC 
CTGTTTCGCG CCAACCTCGC CGGGGCCGAT CTCCGGGGCG CCGATCTCAG GGGTGCCGAT 
CTGAAGAATG CCCGGCAGGA TGACACCAAG AAGGGCGAGC TGGACGGCAC CAGCCTGGCC 
ACCAGGCTCT GA

Protein sequence

MSERFKAAAK TNGEGSAASA RKGGADDHAI VGRRISQEAL KRLSELHTRY LKGIPNGWCA 
VMKECDLSGL DFRNLNFSHG HFIGCDFTGC DLEDAHFSGA NLFSANFDHA NLTRTNFSRA 
DLRGANFEDA EMADAQLDGA DLRRGAVIRR GASAPVGREN SSFRGARMYG TNMAECKLLD 
ADFEGASISG ASLQGADLRG ANFAGAELKG VELSGANLAD ADFRRAVMDE ATIARGDMMR 
ATRPRPAPNP ERMEKILALH LEWIQTGQQK GQRADFTRMD LSRKDFSRAV LAGAHFREAI 
LADANFEKAI LAAADFSNAI LFRANLAGAD LRGADLRGAD LKNARQDDTK KGELDGTSLA 
TRL