Gene PCC8801_2999 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	PCC8801_2999
Symbol
ID	7104491
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Cyanothece sp. PCC 8801
Kingdom	Bacteria
Replicon accession	NC_011726
Strand	-
Start bp	3106019
End bp	3107158
Gene Length	1140 bp
Protein Length	379 aa
Translation table	11
GC content	49%
IMG OID	643476028
Product	TRAP dicarboxylate transporter- DctP subunit
Protein accession	YP_002373142
Protein GI	218247771
COG category	[Q] Secondary metabolites biosynthesis, transport and catabolism
COG ID	[COG4663] TRAP-type mannitol/chloroaromatic compound transport system, periplasmic component
TIGRFAM ID	[TIGR01409] Tat (twin-arginine translocation) pathway signal sequence

Plasmid Coverage information

Num covering plasmid clones	n/a
Plasmid unclonability p-value	n/a
Plasmid hitchhiking	n/a
Plasmid clonability	n/a

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAAACGGC GAAACCTCGT TAAAGCAACC TCTCAGGGTG CGATCGCAGC AACGGTTGCC 
GGGATAGCAA TAGGATGCAG CAAGTCCCAG AACCAAGCAA CCTCTAACAA CACAGAACTG 
CCAAAAATTA CTTGGCAGAT GGCCACTAGC TGGCCGCTGT CCCTCGATAC AATCTTTGGT 
GGCGCGACGG TTTTTGCCGA AAGAGTGGCT CAGATGAGCG GTGGACGCTT TAAAATCTCC 
CCCAAACCCG CCGGAGACTT AGCTCCCCCC CTAGAAGTCT TAAACGTGGT TAAGCAAGGG 
GCTGTTCCCT GCGGTCACAC GGCTGCTTAT TATTACATCG GACAAAATCC GGCCGCTGCT 
TTCGGTACGG CTGTCCCTTT TGGACTGACG GCTCAACAAC AAAATACTTG GCTCTATGAA 
GGGGAAGGCT TAAAACTATT GCAGGAACTC TACGCCAGCC AATTCGGAGT CATCCAATTT 
CCGGCGGGTA GCACGGGCAC ACAGATGGGG GGGTGGTTTC GCAAGGAAGT CTCAACCATT 
AACGACTTAA AGGGGCTAAA AATGAGGATT CCGGGCTTGG GGGGTCAGGT AATGAGTAAG 
TTGGGGGTGC TGGTGCAAAA TCTCCCAGGA GGGGAAATTT TCCAGGCTCT ACAAACGGGT 
GCTATTGATG CAGCCGAATG GGTTGGCCCC TACGATGATG AAAAATTGGG ACTTAATAAA 
GTCGCTCAAT ACTATTACTA TCCGGGTTGG TGGGAACCGG GTCCGACTCT GGAAGTGCAA 
ATTAACCTCA ATGCCTGGAA AAAGTTGCCC GTTGAATATC AACAAATGAT CCAGACCGCC 
GCCTTTGAAG CTAATCAGAT CATGCTGGCT CGTTACGAAG CTCGCAACTA TGAGGCATTG 
CAAAGATTGC TACAAAGTGG AACCCAACTG CGCCCCTACA GTGATGAAAT CTTAAATGCA 
GCTAAGACGA GTGCTTTTGA ATTGTATGAC GAATTTGCCG CAAAAAATGC TGATTTTAAA 
GCGATTTTTG AAAACTGGCA GAAGTTCCGC GATGGGGTTT TCACTTGGAG CAATCTCAAT 
CAAGGCAGTT TTGAACGGTT TGTTTACAAA ACTCTCGACA CGCCATCCCA AGGCTCATAA

Protein sequence

MKRRNLVKAT SQGAIAATVA GIAIGCSKSQ NQATSNNTEL PKITWQMATS WPLSLDTIFG 
GATVFAERVA QMSGGRFKIS PKPAGDLAPP LEVLNVVKQG AVPCGHTAAY YYIGQNPAAA 
FGTAVPFGLT AQQQNTWLYE GEGLKLLQEL YASQFGVIQF PAGSTGTQMG GWFRKEVSTI 
NDLKGLKMRI PGLGGQVMSK LGVLVQNLPG GEIFQALQTG AIDAAEWVGP YDDEKLGLNK 
VAQYYYYPGW WEPGPTLEVQ INLNAWKKLP VEYQQMIQTA AFEANQIMLA RYEARNYEAL 
QRLLQSGTQL RPYSDEILNA AKTSAFELYD EFAAKNADFK AIFENWQKFR DGVFTWSNLN 
QGSFERFVYK TLDTPSQGS