Gene Pars_1218 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Pars_1218
Symbol
ID	5055212
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Pyrobaculum arsenaticum DSM 13514
Kingdom	Archaea
Replicon accession	NC_009376
Strand	-
Start bp	1102319
End bp	1103458
Gene Length	1140 bp
Protein Length	379 aa
Translation table	11
GC content	57%
IMG OID	640468765
Product	FAD-dependent pyridine nucleotide-disulphide oxidoreductase
Protein accession	YP_001153438
Protein GI	145591436
COG category	[R] General function prediction only
COG ID	[COG0446] Uncharacterized NAD(FAD)-dependent dehydrogenases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	11
Plasmid unclonability p-value	0.155112
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	32
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCCCAAAA AAGTGGTTAT AGTAGGCGGC GGCGTGGGAG GATCTTTTGT GGCAAACAAG 
CTCGCCTACA AGCTCAGCTC AGAGGTGAGG AAAGGCGAGG TGGAGATAAC TGTCATAGAG 
CCGGCCCAGG TATTACACTA TCAGCCAGGG TATCTCTACG TCCCGTTTAT GGAGCTTCCG 
TCTGACGTAA TGTTCAGAAG CCCCAAGAAG GTGCTGAGCC CGTTGGTTAA GCTCGTGGAG 
AAGCCCGCCG CGAAGATTGA CCTCAAGGCC AAGAAGGTGC AGACGGCAGA CGGCGCCGAG 
TATCCATACG ACTACTTAGT AGTGGCCTCG GGGGCCGTGG CGAGGACCGA CGCGATTCCC 
GGCTTCAACA AGACGTGGTA CACCCTGTGG ACTTACGAAG GAGCGAAGGC GCTTAGGGAG 
AGGCTGAGGT CGTTTACTAG GGGCACTTTG GTCTTCAGTG TGACGTCCAC GCCGTATAAG 
TGCCCCGTGG CGCCGTACGA GTTCCTGTTC ATGTTTGACG ACTACCTCAT GTCCACTGGG 
CTTAAGAAGG ATGTGAAGCT GATCTTCACA ACCGTCGCGC CGCACCTCCA CGCACAGCCC 
AACGTGAACA AGTTCTTGGA GGAGCAGATG AAGATGAGGG GTATTGAGTA CAGGACGAAG 
TTCGAGGTGA AGGAGATCAA GGAGGGCGAG GTGGTTGGCC CAGAGACCAT AAAGGCCGAC 
CTAGTGGTCG CGGTCTCCAA GCACACGCCC GCCGACGTGG TGGTTAATTC GGGGCTAGTG 
GATCAAAGCG GCTGGCTTCC CGTGGATAAG AGCACATTGC AGATACAAGG CGGCTCAGGT 
GTGGAATATG CCATTGGCGA TACCACAAAC CTCGCTGTGC CGAAGGCCGG TTCCGTGGCC 
CACTTCCAGT CGGAGGTCGT GGCGTCGCGG ATACACGAGG AGATTACCTT GGGCCACGCC 
GACACGGTGT ACAGAGGTCG GGTGATCTGT TTTATAATGA CCGGTTTTGA GGAGGCTACC 
CAGGTGTCGT GGAATTACGA AAACCCGGCG CTGTACCCGC CGCCCAGTAG CAAGTTCTTC 
GCGAGGCTTA AGGACCTCAC CAACTACTCG ATATGGGGAG TCATGAGGTG CGGCCTATGA

Protein sequence

MPKKVVIVGG GVGGSFVANK LAYKLSSEVR KGEVEITVIE PAQVLHYQPG YLYVPFMELP 
SDVMFRSPKK VLSPLVKLVE KPAAKIDLKA KKVQTADGAE YPYDYLVVAS GAVARTDAIP 
GFNKTWYTLW TYEGAKALRE RLRSFTRGTL VFSVTSTPYK CPVAPYEFLF MFDDYLMSTG 
LKKDVKLIFT TVAPHLHAQP NVNKFLEEQM KMRGIEYRTK FEVKEIKEGE VVGPETIKAD 
LVVAVSKHTP ADVVVNSGLV DQSGWLPVDK STLQIQGGSG VEYAIGDTTN LAVPKAGSVA 
HFQSEVVASR IHEEITLGHA DTVYRGRVIC FIMTGFEEAT QVSWNYENPA LYPPPSSKFF 
ARLKDLTNYS IWGVMRCGL