Gene Paes_2021 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Paes_2021
Symbol
ID	6459806
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Prosthecochloris aestuarii DSM 271
Kingdom	Bacteria
Replicon accession	NC_011059
Strand	+
Start bp	2219245
End bp	2220387
Gene Length	1143 bp
Protein Length	380 aa
Translation table	11
GC content	55%
IMG OID	642726004
Product	hypothetical protein
Protein accession	YP_002016678
Protein GI	194334818
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	28
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	7
Fosmid unclonability p-value	0.0664622
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

TTGAAGGCTC GACCCTCACC AAAAGCGTTC TTCATAATCC TGCTGCTGCT GACAGTCGGG 
TGCGCCACTG ACCGCCCTCC TTCCGGAGGC CCTCCGGATA ACGCTCCCCT GCGGATAACA 
GACGTCCAGC CTGAAGCGTC TTTAACCGAT ATTCAGCCAG AAACGATCCG TTTCACCTTC 
AACCGTTATG TCCCCACAGC ATCCCTGAGG CGCTCGATAG TTTTTTCACC AAGGATCACC 
GGCTATGAAA TCAGGGGTGA TGGCGAAGAA GCTGTCATCA TCTTCAACGA GCCTTTTGAG 
CAGAACAGAA CCTATTCGAT CTCATTCAAC ACATCCCTGC AGAGCAGCCG CGGCAACGAA 
CTTGAAAAAA GTTACACCTA CGCTTTTTCA ACCGGTCCCT TTCTCGACAG CGGCGAAATC 
GAAGGAACCG TCTATACCAG GGAGAACAAA CCGGCCAGAG GCGCATTGAT CTATGCGTTT 
CTTCGAGAGC CTCAACAAGC GCAGGCAGAA CAATCAATCC TTGAACGGCA CCCGGACTAC 
GTCGTCCAGA CAGGTACGGA CGGAACCTTC CGCTTCAATC ATCTGAAAAA GGGCAGCTAC 
CGGCTCATGG CCTTCATGGA TAAGGACGGT AACCGGATAC TGAACCTGAA CCATGAAGCG 
CATGCCTCCG GCACGATCGA AAACGTTCCG ACAGGCTCCC GGCCGCTGCT GTTCAGAATG 
TCGTCGCCAC ACGAGGAGAA GCGCCAATCA GCAGCAGCTG GCAAAAACGC ACCCCAGCCG 
ACGGACCCCG GCGCCATTAT CGGAACGATT CGGACCCTGC ACCATGCGGC TGTCATCGAA 
GCAGTCAATA TGACGACAGG CACATGGTAC CGGACAACCG CCGTCAACAC CCGGCATAGA 
GAACAATCGT TTGTGCTGAA AAATCTTCCC GCAGGGCGCT ATCTCGTCAG TGCCTATCTG 
CCCGGAAAGG ATATTGCTGC TGACGGAAGC ATCCCTCAAT GGAGCCCCGG CAATATTTGG 
CCATTCAGGC CCGCAGACGA GCTTGTCATC CACCCCGATC CGGTTATCGT CCGCAAGGGC 
TGGACGACAG GCAACATTGA GCTGAACCTG CAGCCATCAG CGCTGAGAGG AAAAGAGAAA 
TGA

Protein sequence

MKARPSPKAF FIILLLLTVG CATDRPPSGG PPDNAPLRIT DVQPEASLTD IQPETIRFTF 
NRYVPTASLR RSIVFSPRIT GYEIRGDGEE AVIIFNEPFE QNRTYSISFN TSLQSSRGNE 
LEKSYTYAFS TGPFLDSGEI EGTVYTRENK PARGALIYAF LREPQQAQAE QSILERHPDY 
VVQTGTDGTF RFNHLKKGSY RLMAFMDKDG NRILNLNHEA HASGTIENVP TGSRPLLFRM 
SSPHEEKRQS AAAGKNAPQP TDPGAIIGTI RTLHHAAVIE AVNMTTGTWY RTTAVNTRHR 
EQSFVLKNLP AGRYLVSAYL PGKDIAADGS IPQWSPGNIW PFRPADELVI HPDPVIVRKG 
WTTGNIELNL QPSALRGKEK